Nagios es una plataforma diseñada para correr bajo sistemas Linux, pero funciona correctamente bajo la mayoría de las variantes UNIX existentes.
Su funcionamiento básico consiste en una arquitectura cliente-servidor mediante ejecución de polling periódico de chequeos de recursos (con agente) y servicios (sin agente) sobre sistemas cliente. Cuando se detecta un error la plataforma es capaz de enviar una notificación (sobre diferentes modos de comunicación) a los contactos administrativos, informando del estado del servicio que ha provocado el error, incluyendo informes de estado, de logs e históricos web).
Nagios proporciona gran cantidad de acciones de monitorización que le permiten ser una potente herramienta de gestión TI.
Sus características principales son:
| |
 |
Gestión de servicios (SMTP, POP3, HTTP, NNTP, PING, etc.) |
| |
 |
Monitorización de recursos de sistemas |
| |
 |
Gestión de servicios pasivos generados por aplicaciones o comandos |
| |
|
externos (servicios pasivos) |
| |
 |
Monitorización de factores ambientales a través de sondas físicas |
| |
|
(temperatura, humedad relativa, luminosidad, líneas de tensión, etc.) |
| |
 |
Arquitectura simple de integración que permita a los usuarios desarrollar |
| |
|
fácilmente sus propios agentes de chequeo de servicios y recursos. |
| |
 |
Definición de arquitecturas jerárquicas de los elementos gestionados que nos permitan |
| |
|
identificar rápidamente avalanchas masivas de caídas de servicios por no alcanzabilidad |
| |
 |
Diferentes notificaciones de errores por tipo de contacto (vía email, sms, wap |
| |
|
u otros servicios de notificación) |
| |
 |
Escalado y distribución de servicios, recursos y nodos gestionados por |
| |
|
grupos de contacto. |
| |
 |
Definición de acciones reactivas que permitan solventar un problema |
| |
|
de forma inmediata. |
| |
 |
Soporte de arquitecturas de servidor redundantes y distribuidas |
| |
 |
Interfície de comandos externos (triggers, web o terceras aplicaciones) |
| |
|
que permitan modificar "on-the-fly" la administración del sistema. |
| |
 |
Retención del último estado de los servicios y recursos que permite paliar |
| |
|
pérdidas del sistema gestor. |
| |
 |
Programación de intervalos de tiempo sin notificaciones. |
| |
 |
Visión rápida y sencilla de los elementos gestionados |
| |
 |
Portal web que permite consultar el estado de los elementos gestionados, las |
| |
|
notificaciones realizadas, los problemas acontecidos, el estado de los servidores, la |
| |
|
administración básica, etc. |
| |
 |
Definición de usuarios de lectura y administración del portal web. |