Nutanix Cluster Services caídos – Solución de problemas – HyperHCI.com
Nutanix cluster/CVM ejecuta cientos de servicios para ejecutar y mantener el cluster, pero ¿qué pasará cuando los servicios de Nutanix cluster/CVM dejen de funcionar? Obviamente, es necesario solucionar problemas de los servicios del clúster/CVM de Nutanix para que vuelva a funcionar y que el estado del clúster se vuelva verde.
Es muy difícil para cualquier administrador solucionar problemas de los servicios inactivos del clúster Nutanix/CVM de Nutanix. Así se mencionan los sencillos pasos para solucionar problemas de los servicios de clúster Nutanix/CVM.
Solución de problemas de los servicios de clúster de Nutanix
Solucionemos problemas comunes de los servicios de clúster Nutanix/CVM para resolverlos y cambiemos el estado del clúster Nutanix/CVM a verde.
Lea también: No agrupe muchos servicios críticos
Una pregunta 1: Se corrigió la actualización debido a que Génesis no podía iniciar los servicios detrás del servicio Cassandra
Resolución : Para resolver la actualización bloqueada debido a que Genesis no puede iniciar los servicios detrás del servicio Cassandra: ejecute después del comando desde cualquier CVM Nutanix en el clúster
nutanix@cvm$ allssh 'genesis restart'
Problema 2: el servidor DNS inalcanzable puede impedir que los clústeres de 2 nodos inicien servicios después de la conmutación por error
Resolución : Para resolver el servidor DNS inalcanzable, puede evitar que 2 grupos de nodos inicien los servicios después de la falla: verifique la entrada del servidor DNS/nombre en el archivo de configuración CVM y verifique la conectividad.
Comando 1: Verifique la entrada del servidor DNS/de nombres en la configuración del clúster
nutanix@cvm:~$ zeus_config_printer | grep name_server
Comando 2: luego verifique la entrada del servidor de nombres/DNS en todos los archivos de configuración de CVM.
nutanix@cvm:~$ allssh "cat /etc/resolv.conf"
Si no se encuentra la entrada DNS, agregue la dirección IP/nombre de host del servidor DNS de Prism como se muestra en la siguiente captura de pantalla.
Asegúrese de que se pueda acceder al servidor DNS antes de ingresar la dirección IP/nombre de host DNS.
Problema 3: SSP: Activación de los servicios del portal de autoservicio
Resolución: Para resolver SSP: Habilitación de servicios de portal de autoservicio: requisito para habilitar el servicio SSP en todos los CVM Nutanix
Los servicios para la función Portal de autoservicio (SSP) se desactivan automáticamente en los hosts AHV en los que la máquina virtual del controlador tiene menos de 24 GB de memoria.
SSP solo se admite en hosts AHV.
Paso 1: verifique la asignación de memoria Nutanix CVM, que debe ser de al menos 24 GB o más, estará bien.
nutanix@cvm$ free -m
Paso 2: Si la asignación de memoria Nutanix CVM es inferior a 24 GB, entonces es necesario aumentar la memoria a al menos 24 GB o más.
Opción 1: Agregar/añadir memoria CVM Nutlanix desde la consola Prism
opcion 2: Aumentar/Escale la memoria CVM de Nutanix desde la línea de comando
Paso 3: Reinicie el servicio Genesis en todos los CVM Nutanix
nutanix@cvm$ allssh genesis restart nutanix@cvm$ allssh genesis stop prism nutanix@cvm$ cluster start
Problema 4: Tenga en cuenta que los servicios CVM/Clúster no funcionan
Solucionemos el problema de los servicios Nutanix Cluster/CVM. En primer lugar, intente comprender los servicios críticos del clúster Nutanix aquí:
Aquí encontrará una breve lista de los servicios críticos de Nutanix:
- acrópolis
- andruil
- aplausos
- applos_motor
- Catálogo
- configuración_clúster
- sincronización_clúster
- delfos
- ergón
- fluir
- lazan
- minerva_cvm
- administrador_snmp
- sys_stat_collector
- uhura
- compra
Leer más: Servicios más críticos del Nutanix Cluster
Resolución: verifique el estado de los servicios Nutanix CVM/Clúster y reinícielos.
Paso 1: Verifique el estado de los servicios Nutanix CVM/Clúster
nutanix@CVM$ ncc health_checks run_all nutanix@CVM$ ncc health_checks system_checks cluster_services_status nutanix@CVM$ ncc health_checks system_checks cvm_services_status nutanix@cvm$ ncc health_checks hypervisor_checks check_services nutanix@cvm$ ncc health_checks system_checks cluster_services_down_check
Control de salud del NCC estado_servicios_clúster verifique si los servicios del controlador VM (CVM) se han reiniciado recientemente en todo el clúster.
Se controlan los siguientes servicios:
- administrador_alerta
- arritmias
- cassandra_monitor
- cerebro
- cronos_nodo_main
- cluster_manager_monitor
- hiperint_monitor
- pitos
- monitor_prisma
- puerta estelar
- stargate_monitor_main
- stats_aggregator_monitor
- monitor_zookeeper
- curador
Paso 2: Lista breve de servicios inactivos en todos los CVM de Nutanix
nutanix@pcvm$ cluster status | grep -v UP
Paso 3: Inicie los servicios Nutanix CVM/Clúster
nutanix@pcvm$ cluster start
Nota: El comando anterior no afectará la producción que se ejecuta en las máquinas virtuales.
Paso opcional 4: Si el comando del paso 3 no inicia los servicios, puede reiniciar Nutlanix Node o Nutanix CVM.
Paso 4.1: Reinicie Nutanix CVM
nutanix@cvm$ cvm_shutdown -r now
Paso 4.1.1: O Apague Nutanix CVM
nutanix@cvm$ cvm_shutdown -P now
Paso 4.1.2: Activar Apagar Nutanix CVM
SSH al host Nuanix AHV
root# virsh list --all | grep CVM
En el resultado verá el nombre de CVM, cópielo y ejecute el siguiente comando para iniciar Nutanix CVM
root# virsh start <CVM_Name>
Espere 5 minutos para que se inicien los servicios CVM y Nutanix.
O Paso 4.2 : Puede poner su host en modo de mantenimiento y luego reiniciar el nodo
Leer más: Habilite el modo de mantenimiento Nutanix CVM y AHV
Leer más: Cómo apagar/reiniciar Nutanix AHV Host y Nutanix CVM
Último paso : Ahora verifique el estado del clúster Nutanix y los servicios en ejecución.
nutanix@pcvm$ cluster status
Problema 5: No se alcanzó la puerta de enlace de Notanix. error de solicitud HTTP
Resolución: Es necesario reiniciar los servicios de la consola Nutanix en el host, que es el líder de Prism.
Paso 1: Encuentre el líder de Prism de Nutanix: verifique qué nodo del clúster es el líder de Prism, es decir, el CVM que ejecuta los servicios de contenedor de Prism.
nutanix@cvm$ curl http://0:2019/prism/leader && echo
El resultado debería ser similar al siguiente
{"leader":"xx.xx.xx.10:9080", "is_local":false}
Significa que xx.xx.xx.10 CVM es el líder de Prism.
Paso 2: SSH a Prism Leader y ejecute el siguiente comando para reiniciar el servicio Prism.
nutanix@cvm$ genesis stop prism nutanix@cvm$ cluster start
Nota: No hay ningún impacto en la ejecución de producción de los comandos anteriores.
Lea también: La consola web Nutanix Prism es lenta, no funciona y se bloquea la solución de problemas
Problema 6: Crítico: Servicio de Cluster Server: Aplos se detiene en la máquina virtual del controlador
Problema 7: La actualización de LCM falla con el error «Los servicios no están activos» en un clúster de 2 nodos
Resolución: Ambos servicios se ejecutan en el marco LCM.
Este es un problema conocido. por lo tanto, se recomienda actualizar la versión del marco Nutanix NCC y LCM a la última versión disponible.
Lea también: ¿Cómo funciona el marco de gestión del ciclo de vida de Nutanix LCM?
Ojalá hayas aprendido algo nuevo y un tema interesante hoy.
gracias por estar con Blog tecnológico de HyperHCI estar atentos y seguir aprendiendo hasta el último aliento.