Problema.
Condor no inicia en un nodo específico. En sus logs se encuentran mensajes como los siguientes.
CollectorLog
08/11 21:59:35 AUTHENTICATE: handshake failed!
08/11 21:59:35 ERROR: SECMAN:2004:Failed to create security session to <192.168.1.230:9180> with TCP.|AUTHENTICATE:1002:Failure performing handshake|AUTHENTICATE:1004:Failed to authenticate using PASSWORD
MasterLog
08/11 22:00:36 DC_AUTHENTICATE: authenticate failed: AUTHENTICATE:1002:Failure performing handshake|AUTHENTICATE:1004:Failed to authenticate using PASSWORD
08/11 22:00:36 condor_write(): Socket closed when trying to write 297 bytes to <192.168.1.230:45838>, fd is 10
08/11 22:00:36 Buf::write(): condor_write() failed
08/11 22:00:36 SECMAN: Error sending response classad!
08/11 22:00:36 error: SEC_PASSWORD_FILE must be owned by Condor’s real uid
Explicación.
El archivo donde se almacena la contraseña del cluster para la autenticación basada en las mismas, tiene un propietario o unos permisos incorrectos.
Solución.
Identificar la ubicación del archivo de contraseñas.
# condor_config_val SEC_PASSWORD_FILE
/etc/condor/condor_credential
Verificar sus permisos y propietario.
# ls -l /etc/condor/condor_credential
-rw-r–r– 1 condor root 256 Aug 11 21:47 /etc/condor/condor_credential
Corregir sus permisos y propietario.
# chown root:root /etc/condor/condor_credential
# chmod 600 /etc/condor/condor_credential
# ls -l /etc/condor/condor_credential
-rw——- 1 root root 256 Aug 11 21:47 /etc/condor/condor_credential