Olrait! otro problemilla de estos tontos que tenía pendientes de solucionar, resuelto!
La cosa es que hace un par de meses actualicé un proxmox 6.4 a 7.0, con major upgrade del sistema operativo (debian 10 a debian 11) incluso antes que saliese liberada la propia debian 11! Al hacerlo también tuve que subir la versión de ceph de nautilus (14.x) a octopus (15.x).
Al terminar, aquella misma noche recibo un mensaje de todos y cada uno de los servidores que había actualizado el ceph
Asunto: *** SECURITY information for planet1A.lamardebits.org ***
Cuerpo:
planet1A.lamardebits.org : Sep 9 00:08:13 : ceph : a password is required ; PWD=/ ; USER=root ; COMMAND=nvme wdc_wd4003ffbx-68mu3n0 smart-log-add –json /dev/sdb
La solución viene hoy pues tras encontrar éste mail en las listas de proxmox. Hay que entender el problema, falta algo en sudo o algo otro en otro programa para que suelte esto:
Primero será mirar qué hay en sudoers
root@planet1A:/etc/sudoers.d# cat ceph-osd-smartctl ## allow ceph-osd (which runs as user ceph) to collect device health metrics ceph ALL=NOPASSWD: /usr/sbin/smartctl -a --json=o /dev/* ceph ALL=NOPASSWD: /usr/sbin/nvme * smart-log-add --json /dev/*
Después será mirar si existe el keyring de ceph para conectar con los otros ceph:
root@planet1A:~# cat /var/lib/ceph/bootstrap-osd/ceph.keyring [client.bootstrap-osd] key = *****************************
Finalmente y lo que ha sido creo la solución, porque al mirar ambas cosas estaban correctas, ha sido instalar el paquete nvme-cli y listos, sin reiniciar ni nada.
root@planet1A:~# apt -y install nvme-cli
Cada día, al ejecutarse la copia de seguridad salía el error de marras, hoy a las 2 de la mañana, ya no ha vuelto a salir el mensaje! :)
Si el mensaje sigue saliendo en el ceph, en cualquiera de los nodos que tenga ceph, ejecutar esto:
ceph config set mon auth_allow_insecure_global_id_reclaim false