Problemas de desempenho na rede? De quem é a culpa?

Uma interrupção na rede é sinônimo de prejuízo para qualquer empresa. Diante desse cenário delicado, as equipes que lidam diretamente com a TI da empresa certamente ficam pressionadas. Portanto, sem visibilidade da rede a situação certamente ficará caótica.

Não devemos procurar culpados, mas sim soluções. Entretanto, em muitos casos a solução só é possível após descobrir o culpado. O foco não é “culpar”, mas sim corrigir o problema. Finalmente evitando o “Jogo de empurra”, onde cada equipe transfere a culpa para outra.

Abaixo, temos um cenário que ilustra a importância de possuir meios para achar o “culpado”

CENÁRIO

Uma empresa estava sofrendo com a interrupção recorrente de um de seus serviços. Esse serviço em específico depende da sua infraestrutura de rede em conjunto com servidores de banco de dados. A equipe que cuidava do banco  de dados dizia que o problema era de infraestrutura, e a equipe de infraestrutura dizia ser problema era no banco de dados. As equipes estavam pressionadas. Principalmente, pelo serviço interrompido ser uma atividade importante para captação de receitas da empresa.

Diante desse cenário, a empresa resolveu implantar o TRAFip e o SLAview. Durante a implantação, foi feito um levantamento de todos os ativos que estavam entre o banco de dados e os clientes. Assim, todos seriam monitorados, inclusive os servidores.

Com o monitoramento, um servidor em específico chamou a atenção. Percebeu-se que até o momento da interrupção, tanto o tráfego destinado quanto o originado para o servidor estava caindo. Entretanto, a carga de processamento estava ficando muito alta. 

De posse dessas informações que continham além dos detalhes citados, o horário do evento, foi possível direcionar o foco. Desse modo, foi solicitado o relato da equipe de banco de dados sobre as modificações que estavam sendo executadas naquele servidor no horário observado. Verificou-se que, nessa situação em específico, estavam sendo feitas uma série de comandos no banco de dados, o que causava um efeito em cascata e deteriorava todo o funcionamento do sistema. Bastou interromper os comandos que o sistema voltou ao normal.

Nesse cenário o que foi crucial para se chegar a raiz do problema?

A RAIZ DO PROBLEMA

O cenário acima mostra o potencial do monitoramento da rede. Principalmente unindo as informações obtidas através da exportação de fluxos e dados obtidos através do protocolo SNMP.

Com dados troca-se o “eu acho” pelo “me deixe lhe mostrar”. Anteriormente uma equipe transferia a culpa uma para a outra. Com o monitoramento mostrando exatamente a raiz do problema, sendo a alta carga de processamento junto a uma queda de tráfego em um servidor em específico, em um horário em específico, fez com que se chegasse a raiz do problema.

Nesse caso em específico, observou-se um alto consumo de processamento devido á uma sobrecarga exercida pelo banco de dados. Porém, outros cenários podem afetar o desempenho da CPU como, por exemplo, um elevado número de acessos simultâneos. Contudo, foi observado que o tráfego estava diminuindo. Diante dessa perspectiva, destaca-se o uso do monitoramento de tráfego e monitoramento desempenho onde um complementa a outro.

O mais importante é a capacidade em ter agilidade para resolver problemas. Bem como, possuir dados através de gráficos e relatórios que apontem a fonte do problema. Assim, permitindo a investigação mais profunda até chegar a causa raiz. Primordialmente, evitando conflitos desnecessários entre as equipes na corrida pelo culpado.

Com a visibilidade da rede os benefícios não serão só a rápida resolução de problemas, mas também a antecipação dos mesmos. Com relatórios, gráficos e alarmes em tempo real permitindo a equipe de TI, agir com mais eficiência e proatividade.

CONSIDERAÇÕES FINAIS

Neste sentido, não há dúvidas sobre a importância do investimento no gerenciamento da rede. Dessa forma, trazendo não apenas benefícios para a visibilidade da rede, mas também sendo uma forma complementar de buscar a prevenção de problemas que possam causar a queda de serviços da rede.

Pensando nisto, a Telcomanager que está desde 2002 no mercado, líder da América Latina no setor de software para gerência de redes, com uma metodologia única e inovadora, disponibiliza soluções inteligentes no monitoramento de dados que irão prover visão estratificada do tráfego, permitindo que a sua empresa acompanhe os principais aspectos de sua rede em tempo real.