Article

¿Qué es Nagios?

Herramienta para gestión-diagnóstico de Red

Nagios es un sistema de monitorización de redes de código abierto ampliamente utilizado, que vigila los equipos (hardware) y servicios (software) que se especifiquen, alertando cuando el comportamiento de los mismos no sea el deseado.

Entre sus características principales figuran la monitorización de servicios de red (SMTP, POP3, HTTP, SNMP…), la monitorización de los recursos de sistemas hardware como carga del procesador, uso de los discos, memoria, estado de los puertos entre otros, independencia de sistemas operativos, posibilidad de monitorización remota mediante túneles SSL cifrados o SSH, y la posibilidad de programar plugins específicos para nuevos sistemas.

Es un software que proporciona una gran versatilidad para consultar prácticamente cualquier parámetro de interés de un sistema, y genera alertas, que pueden ser recibidas por los responsables correspondientes mediante (entre otros medios) correo electrónico y mensajes SMS, cuando estos parámetros exceden de los márgenes definidos por el administrador de red.

Es originalmente diseñado para ser ejecutado en GNU/LINUX, pero también se ejecuta bien en variantes de UNIX.

Sus características principales son:

  • Gestión de servicios (SMTP, POP3, HTTP, NNTP, PING, etc.).
  • Monitorización de recursos de sistemas.
  • Gestión de servicios pasivos generados por aplicaciones o comandos externos (servicios pasivos)
  • Monitorización de factores ambientales a través de sondas físicas (temperatura, humedad relativa, luminosidad, líneas de tensión, etc.)
  • Arquitectura simple de integración que permita a los usuarios desarrollar fácilmente sus propios agentes de chequeo de servicios y recursos.
  • Definición de arquitecturas jerárquicas de los elementos gestionados que nos permitan identificar rápidamente avalanchas masivas de caídas de servicios por no alcanzabilidad
  • Diferentes notificaciones de errores por tipo de contacto (vía email, sms, wap u otros servicios de notificación)
  • Escalado y distribución de servicios, recursos y nodos gestionados por grupos de contacto..
  • Definición de acciones reactivas que permitan solventar un problema de forma inmediata.
  • Soporte de arquitecturas de servidor redundantes y distribuidas.
  • Interfície de comandos externos (triggers, web o terceras aplicaciones) que permitan modificar “on-the-fly” la administración del sistema.
  • Retención del último estado de los servicios y recursos que permite paliar pérdidas del sistema gestor.
  • Programación de intervalos de tiempo sin notificaciones.
  • Visión rápida y sencilla de los elementos gestionados
  • Portal web que permite consultar el estado de los elementos gestionados, las notificaciones realizadas, los problemas acontecidos, el estado de los servidores, la administración básica, etc.
  • Definición de usuarios de lectura y administración del portal web.

Comments Closed.