Uno de los términos más conocidos en el departamento de TI es el de «backup» o copia de seguridad. Incluso los usuarios finales, que no son profesionales en tecnología de la información conocen este concepto y, probablemente, ya lo escucharon muchas veces. Esto refleja la importancia de esta práctica en diversas situaciones y tecnologías, desde contextos más simples como una copia de seguridad de los mensajes de WhatsApp hasta situaciones más críticas, como la copia de seguridad de un banco de datos, por ejemplo.

En un ambiente de TI, pueden realizarse diferentes tipos de copias de seguridad, ya que permiten mantener los datos guardados para que en el caso de que se eliminen e incluso sean corrompidos, de manera accidental o no, se puedan recuperar.

En este sentido, debido a la relevancia e importancia de algunos servicios y procesos de la infraestructura de TI, es necesario la configuración de la copia de seguridad. Además, si es posible, debe realizarse de forma automática para dinamizar la operación del equipo de profesionales. Sin embargo, no basta solo con automatizar el proceso, también es necesario saber si se está realizando, ya que si se produce un problema, para que no haya sorpresas y la copia sea antigua o esté desactualizada.

En este artículo, abordaremos el caso de un cliente que monitorea con SLAview los backups (snapshots)  de sus servidores AWS y cómo este monitoreo es importante.

Caso de monitoreo de backup en servidores AWS

SLAview es un sistema robusto de Telcomanager que viene embebido en un appliance de fabricación propia y dimensionado para cualquier demanda. Su función es realizar el monitoreo de rendimiento y fallas de todo el ambiente TI del cliente. A continuación, destacaremos cómo es fundamental el monitoreo de la copia de seguridad de los servidores en nube AWS.

Cuando estos servidores todavía no eran monitorizados por SLAview, uno de ellos presentó una falla que generó una pérdida de datos, por lo que la primera acción del colaborador del equipo de Cloud fue restaurar los datos a través de la última copia de seguridad realizada. Sin embargo, para la sorpresa del equipo, el último backup había sido realizado meses atrás, lo que causó una pérdida de datos al cliente.

Después, el equipo solicitó a Telcomanager el monitoreo de la copia de seguridad de estos equipos a través de SLAview para que en caso de que algún backup no fuese realizado en algunas horas, una alarma empezara a funcionar y avisase al equipo de Cloud para que fueran a investigar la cuestión.

Como SLAview es un sistema versátil permite diversos tipos de recolectas, como consultas SNMP, ICMP e incluso recolectas basadas en scripts que pueden integrarse con API. En este caso específico, a través de la API de la AWS fue posible recolectar la información de la copia de seguridad de los servidores.

Ahora, cuando no se realiza una copia de seguridad en una máquina, se notifica al equipo responsable. Así, en caso de que se produzca una falla, los datos no se pierden y pueden ser recuperados.

Por tanto, se resolvieron dos problemas principales: El primero, el cliente no necesitó acceder al ambiente para verificar si el backup estaba siendo realizado, lo que es un procedimiento costoso para los colaboradores y no es fiable, ya que en algún momento puede olvidarse. El segundo, como ya señalamos, es que no es necesario preocuparse con la pérdida de datos ocasionada por la falla en los servidores.

Integraciones con SLAview

El caso anterior fue citado solo como un ejemplo para mostrar este tipo de monitoreo, sin embargo, las integraciones de SLAview con otros sistemas son diversas, como, por ejemplo, la integración con el portal de Meraki (Cisco) de una red SDWAN de otro gran cliente.

Los usuarios de las soluciones Telcomanager tienen la libertad de montar estas integraciones, así como la posibilidad de solicitar a nuestro soporte técnico especializado un monitoreo específico que necesita de una determinada integración. Nuestras herramientas y soluciones son extremadamente flexibles.

Consideraciones finales

Por tanto, es evidente la importancia de no solo monitorear los procesos de copia de seguridad automatizados, sino también de tener un sistema de monitoreo completo como aliado para ayudar en las tareas más difíciles y complejas, como los procesos que para monitorear exigen ciertas integraciones.

Teniendo esto en cuenta, Telcomanager que está desde el 2002 en el mercado, líder de América Latina en el sector de software para la gestión de redes, ofrece soluciones inteligentes con una metodología única e innovadora para el monitoreo de datos, lo que proporciona una visión completa de su infraestructura, permitiendo que su empresa controle los principales aspectos de su red en tiempo real.