Arquitetura Distribuída para redes de grandes dimensões

As ferramentas de gerência de rede são peças fundamentais em um ambiente onde os requisitos confidencialidade, desempenho, análise de falhas, segurança, caracterização de tráfego, QoS, planejamento de rede e previsão de tráfego devem ser monitorados e avaliados constantemente para garantir qualidade na entrega de serviços.

A Telcomanager possui um sistema de gerenciamento baseado em appliances. A solução em appliances da Telcomanager é adaptável a determinados tamanhos de rede. Para cada tipo de rede, existem diversos modelos diferenciados em processamento e armazenamento de dados que são condizentes com quantidade de fluxos e dispositivos que a rede possui, sem deixar brechas para perda de informações e lentidão no sistema de gerência.

Ilustração que demonstra os tráfegos de requisições SNMP e dos fluxos como NetFlow, JFlow, SFlow e Netstream.
Figura 1: Ilustração que demonstra os tráfegos de requisições SNMP e dos fluxos como NetFlow, JFlow, SFlow e Netstream.

Para redes com muitos dispositivos, onde há uma quantidade muito grande de fluxos, é implementada a solução em Arquitetura Distribuída. Trata-se de um sistema de gerenciamento em que são utilizados dispositivos denominados coletores e consolidadores que colaboram para uma melhor performance no processamento e na capacidade de coleta de informações, proporcionando um monitoramento ágil e eficiente de toda rede, sem perda de dados importantes.

Os coletores não são simples repassadores de informação. Tratam-se de appliances que formam uma arquitetura em cluster, e que atuam no processamento dos dados brutos, transformando-os em dados sumarizados, que são tratados a partir das necessidades do cliente para a obtenção da análise desejada. A partir da coleta e do processamento em cada coletor, as informações são transferidas para o dispositivo consolidador, appliance que concentra todos os dados já processados e entrega ao usuário para a completa visualização e análise nas ferramentas TRAFip e/ou SLAview. Conclusão: os operadores de rede terão uma estrutura distribuída, porém, integrada a partir do dispositivo consolidador. Todas as informações de gerência poderão ser encontradas em um dispositivo somente, similar a solução de um único appliance, facilitando a operação do sistema para redes de grandes proporções.

Cada coletor fica encarregado em receber informações de fluxos e requisições SNMP de uma parte da rede. Porém, a robustez e a flexibilidade da arquitetura distribuída garantem redundância entre os coletores, permitindo transferência no monitoramento de uma parte da rede para outro coletor. Através disso, o sistema de gerência introduz a funcionalidade de chaveamento entre os appliances e redundância do consolidador, o que garante plena operação do monitoramento de sua rede.

Atualmente, existem em operação casos de redes com mais de 10000 dispositivos sendo monitorados por uma plataforma composta de menos de 10 appliances, incluindo-se appliances específicos para redundância.

Figura 2: Ilustração que demonstra os tráfegos em um sistema de arquitetura distribuída.
Figura 2: Ilustração que demonstra os tráfegos em um sistema de arquitetura distribuída.

Em um ambiente distribuído, o usuário ainda possui total controle e supervisão de seus coletores. Através das ferramentas TRAFip e SLAview, é possível visualizar as principais informações destes dispositivos como: endereços IP e status atual do dispositivo.

Figura 3: Ferramenta contendo as principais informações dos 8 coletores que fazem parte do sistema de gerência. Dados visualizados a partir do consolidador.
Figura 3: Ferramenta contendo as principais informações dos 8 coletores que fazem parte do sistema de gerência. Dados visualizados a partir do consolidador.

Parâmetros de Arquitetura Distribuída gerenciáveis nas ferramentas TRAFip e SLAview

Existem parâmetros específicos totalmente configuráveis através das ferramentas TRAFip e SLAview para uma arquitetura distribuída. Por exemplo, no momento em que um dispositivo de rede é cadastrado na ferramenta de gerência, é necessário associá-lo de maneira lógica no sistema a uma determinada coletora em que o dispositivo está fisicamente ligado. Assim, o usuário possui total liberdade para organizar o conjunto de coletores em sua rede e quais dispositivos estarão conectados a cada um dos mesmos, proporcionando mais flexibilidade ao operador e liberdade na construção das topologias de rede em conjunto com os dispositivos de gerência.

Figura 4: Tela de cadastro de dispositivos na ferramenta de gerência, a partir do consolidador. Nesse caso, o campo “Coletor” associado ao dispositivo é informado.
Figura 4: Tela de cadastro de dispositivos na ferramenta de gerência, a partir do consolidador. Nesse caso, o campo “Coletor” associado ao dispositivo é informado.

Em casos de falha, por exemplo, quando há perda de alimentação no coletor por falta de energia, o usuário não está desamparado. O sistema é inteligente o suficiente para realizar o chaveamento entre coletores após um período de tempo em que um destes não envia dados ao consolidador. A ferramenta possui as informações necessárias para que, caso um determinado coletor modifique seu status para “down”, todos os fluxos e requisições de determinada parte da rede possam ser redirecionados ao coletor de chaveamento correspondente. Além disso, a partir do consolidador, é possível gerar um script de provisionamento para reconfigurar endereços IP’s de destino nos dispositivos que encaminham fluxos do tipo NetFlow ou semelhantes para os coletores chaveados, evitando assim, grandes perdas de informações de tráfego em parte da rede monitorada.

Figura 5: Configuração do tempo esperado até que haja o chaveamento entre coletores. No caso, é verificado a informação de número de falhas consecutivas no envio de informações pelos coletores. Um coletor pode enviar dados a cada 5 minutos. Neste caso, após 6 falhas consecutivas (que corresponde a 30 minutos), as informações serão chaveadas para um outro coletor.
Figura 5: Configuração do tempo esperado até que haja o chaveamento entre coletores. No caso, é verificado a informação de número de falhas consecutivas no envio de informações pelos coletores. Um coletor pode enviar dados a cada 5 minutos. Neste caso, após 6 falhas consecutivas (que corresponde a 30 minutos), as informações serão chaveadas para um outro coletor.

A arquitetura distribuída da Telcomanager proporciona ao usuário:

  • Segurança;
  • Robustez;
  • Alta capacidade de processamento;
  • Flexibilidade na configuração de sua topologia de rede em conjunto com os dispositivos que fazem parte do sistema de gerência;
  • Alto nível de administração e controle;
  • Operação do sistema de maneira simples e prática;
  • Acesso aos dados de dispositivos e/ou tráfego monitorados a partir de um único appliance. Mais uma vez, simples e prático;
  • Custo reduzido em soluções de gerência para redes de grande porte;