Monday, December 15, 2008

Error al levantar servicio de cluster de sql.

Que tal,
Esta semana con los parches de Microsoft, tuve un incidente un poco raro. Al instalar los parches en uno de los nodos, el servicio de cluster nunca levantó.

En el event viewer se registraba lo siguiente:

Cluster node MYCLUSTER failed to make a connection to the node over network 'Hearbeat'. The error code was 5.

The node cannot join the server cluster because it cannot communicate with node MYOTHERNODE over any network configured for internal server cluster communication. Check the network configuration of the node and the server cluster.

Después de estar por unos minutos reintando que levantara el servicio y justo cuando estabamos pensando en restaurar el system state del servidor, dimos con este artículo de la KB de microsoft: http://support.microsoft.com/kb/317232

El artículo aplica solo para servidores Windows NT y 2000 y mis servidores son Windows 2003, de igual manera seguimos la recomendación, que simplemente era reiniciar el servicio de cluster en el nodo que estaba funcionando, despues de hacer esto, el servidor pudo arrancar el servicio de cluster.

Cabe mencionar que hace un par de semanas, la cuenta con la que corre el servicio de cluster se le cambió su password, que fue cambiado, por cierto, usando el comando cluster, aquella vez no hubo problemas, estas son algunas de las cosas raras que pasan.

No comments: