Curso de Nagios (I): Prólogo

Llevo ya varios años ofertando entre mis servicios de consultoría de sistemas, la puesta en marcha de sistemas de monitorización basados en herramientas OpenSource como Nagios, Cacti u Ossim. Nagios lo he visto crecer desde la versión 1.0 hasta la 3.2 y ahora, contemplo fascinado como el fork de Icinga mejora a su antecesor, sin quitarle la potencia y flexibilidad que teníamos de siempre. En todos estos años, he presenciado siempre la mismas diferentes historias con un mismo final, al conversar con los técnicos de las organizaciones:

  • Si, tenemos Nagios pero no lo usamos porque envía demasiados correos...
  • Si, tenemos Nagios pero sin notificaciones y sólo comprobamos que haga ping a los equipos, nadie lo mira
  • Oh si, claro, pero hay que saber mucho para mantenerlo bien, es un rollo
  • Ufff, Nagios está bien para monitorizar Linux, ¿pero qué hacemos con Windows?

... y el final que tienen todas estas historias en común, es siempre que acaban por apagar y desinstalar Nagios con un amargo sabor de boca sobre lo que és y para qué sirve, y claro, cuando llego vendiendo Nagios, pufff no veais lo que me lo que me cuesta :(. Al fín me he animado a escribir una serie de posts que, humildemente me he atrevido a llamar Curso de Nagios (ya se sabe que la ignorancia es muy atrevida), en el que intentaré ir mostrando uno de los caminos que podemos recorrer para configurarlo correctamente y descubrir su verdadera utilidad y potencia, evitar que lo desinstaleis, y contribuir modestamente con alguna de las deficiencias que creo que existen entorno a esta y otras herramientas similares:
  • De los libros que he leído, pienso que todos fallan en lo mismo: sólo llegan a ofrecernos recomendaciones sobre cómo configurarlo, sin proponer una configuración que luego poder adaptar a la realidad de nuestro servicio informático, e ir aprendiendo en el proceso. Reconozco que la curva de aprendizaje es muy elevada cuando empezamos a trabajar con Nagios, y los libros con los que he trabajado, ayudan pero no lo suficiente.
  • La gran mayoría de blogs que hablan sobre Nagios suelen quedarse en la superficie, y no nos explican qué preguntas debemos hacernos durante el proceso de configuración de Nagios, y por supuesto, no ofrecen respuestas.
  • Los servicios de informática están evolucionando en los últimos tiempos y ahora los técnicos tenemos que aprender las cosas de siempre a las que les han cambiado el nombre: ITIL, LeanIT, incidente, respuesta, proactividad, control del cambio, gestión de la capacidad, de la disponibilidad, etc.A veces, pienso que estas cosas se hacen para que los responsables de tomar las decisiones de compra y contratación, no les suene nada y decidan comprar esto que es lo más nuevo y lo mejor, y el futuro.

En resumen, entre tanta documentación técnica sobre Nagios, echo de menos una guía de consultoría que ayude a configurarlo paso a paso en entornos heterogéneos actuales de tamaño considerable (Windows, Linux, ESX, Novell, etc), con administradores que no se ven ni en la máquina del café, y en muchos casos mezclados con personal externo, que no se sienten parte de la organización, y consideran al administrador de Nagios el friki del Linux que se aburre, mientras ellos se dedican a administrar servidores, y todos dirigidos por responsables que pasan el tiempo pidiéndonos informes, y hablándonos de cosas como Itil, gestión de la disponibilidad, de la capacidad, etc.

Intentaré escribir esta guía en una serie de posts, de los que aún no sé el número al que llegaré ni la fecha, pero que espero que os sirva y podais adpatarla en vuestras configuraciones con éxito.

2 comentarios:

Miguel dijo...

Pues yo estoy migrando gran parte de mis tests de Nagios a Pandora FMS y replicados en un HostMonitor. Digamos que por estabilidad, forma de representar y que Nagios se está quedando un poco desfasado (en mi punto de vista) que el resto.

HostMonitor lo tengo instalado en un XP Lite-Mini de 1GB. de HDD y 256 de RAM y puedes monitorear hasta la cafetera si es tecnología IP.

PAC dijo...

Esperaré ansioso ver como llevas a cabo el curso.

Yo he conseguido dejarlo fino funcionando con NSCA y NRPE, además de un poco de maquillaje de iconos, Nagvis y PNP4Nagios para dejarlo bonito.

Aunque para chequeos más elaborados es imprescindible saber algo de programar scripts.