¿Problemas de rendimiento en la red? ¿Quién tiene la culpa?

Una interrupción en la red es sinónimo de perjuicios para cualquier empresa. Frente a esta situación, los equipos de la empresa que actúan directamente con   TI reciben un gran presión. Por tanto, sin visibilidad en la red la situación seguramente será caótica.

No debemos buscar culpables, sino soluciones. Sin embargo, en muchos casos solo es posible encontrar una solución después de haber descubierto al culpable. El objetivo no es «culpar», sino corregir el problema. Además, se debe evitar el «Juego de la patata caliente», en el que cada equipo echar la culpa a otro.

A continuación, presentamos un escenario que ilustra la importancia de tener medios para encontrar al «culpable».

ESCENARIO

Una empresa estaba sufriendo la interrupción continuada de uno de sus servicios. Este servicio en específico depende de su infraestructura de red en conjunto con servidores de banco de datos. El equipo que cuidaba del banco de datos decía que el problema estaba en la infraestructura, y el equipo de infraestructura decía que el problema estaba en el banco de datos. Los equipos estaban recibiendo mucha presión. Especialmente, porque el servicio que se interrumpía era una actividad que proporcionaba importantes recursos a la empresa.

Frente a este escenario, la empresa decidió implementar el TRAFip y el SLAview. Durante la implementación, se recogieron todos los activos que estaban entre el banco de datos y los clientes. Así, todos serían monitoreados, incluso los servidores.

Con este monitoreo, llamó la atención un servidor específico. Se vio que antes del momento de interrupción, tanto el tráfico destinado como el originado al servidor caía. Además, la carga de procesamiento era muy alta.

Con estas informaciones, que incluían además de los detalles citados el horario del evento, fue posible centrarse en el problema. Así, se solicitó un informe al equipo del banco de datos sobre las modificaciones que se ejecutaban en ese servidor en el horario observado. Se verificó que en esa situación específica se estaban haciendo una serie de comandos en el banco de datos, lo que causaba un efecto en cascada y deterioraba todo el funcionamiento del sistema. Solo se necesitó interrumpir los comandos y el sistema volvió a funcionar normalmente.

En este ejemplo, ¿qué fue crucial para llegar a la raíz del problema?

LA RAÍZ DEL PROBLEMA

El escenario anterior es una prueba del potencial del monitoreo de la red. Especialmente uniendo la información obtenida a través de la exportación de flujos y los datos obtenidos a través del protocolo SNMP.

Con los datos se cambia el «creo» por el «te lo enseño». Antes un equipo echaba la culpa al otro. El monitoreo mostró exactamente la raíz del problema, la alta carga de procesamiento junto a la caída de tráfico en un servido específico en un horario determinado, lo que hizo que se llegase a la raíz del problema.

En este caso específico, se observó un alto consumo de procesamiento debido a una sobrecarga ejercida por el banco de datos. Sin embargo, otras situaciones pueden afectar al rendimiento del CPU como, por ejemplo, un elevado número de accesos simultáneos. De cualquier forma, se observó que el tráfico estaba disminuyendo. Ante este problema, destaca el uso del monitoreo de tráfico y de rendimiento, ya que una información complementa a la otra.

Lo más importante es la capacidad de tener agilidad para resolver problemas. Así como poseer datos a través de gráficos e informes que apunten a la fuente del problema. Esto permite un estudio más profundo que permite llegar a la causa de raíz. Especialmente, evitando conflictos innecesario entre los equipos para encontrar al culpable.

Los beneficios de la visibilidad de la red no son solo la rápida resolución de problemas, sino también la capacidad de anticiparse a ellos. Con informes, gráfico y alarmas en tiempo real se permite al equipo de TI actuar con más efectividad y proactividad.

CONSIDERACIONES FINALES

En este sentido, no hay duda sobre la importancia de invertir en la gestión de la red. Así, no solo obtendrás beneficios de visibilidad de red, sino que tendrás una forma complementaria de prevenir problemas que puedan causar la interrupción de los servicios de la red.

Teniendo esto en cuenta, Telcomanager que está desde el 2002 en el mercado, líder de América Latina en el sector de software para la gestión de redes, ofrece soluciones inteligentes con una metodología única e innovadora para el monitoreo de datos, lo que proporciona una visión estratificada del tráfico, permitiendo que su empresa controle los principales aspectos de su red en tiempo real.