O sistema de monitoramento é uma
das medidas que devemos implementar em nossas infraestruturas para mantê-las em
funcionamento, e considero uma das mais críticas, no entanto, uma das mais
negligenciadas.
A construção de um sistema de
monitoramento contínuo tem por objetivo primordial notifica-lo da
indisponibilidade ou problema iminente, possibilitando a escolha rápida de uma
solução para um desastre em potencial ou em andamento. Também serve para
notificar problemas de desempenho de uma maneira geral. No entanto, as diversas
atividades desenvolvidas pelos times de TI, tendem a empurrar a implementação e
a manutenção de um sistema de monitoramento para o segundo plano.
Não importa o tipo de sistema de
monitoramento você opte por usar, raramente eles são do tipo configurar e
esquecer. A menos que você tenha um ambiente extremamente simples, o
acompanhamento diário para a eliminação de falsos positivos é de fundamental
importância. Toda ferramenta precisa de um “TREINAMENTO” para que possa ser
confiável e isto demanda tempo.
É importante ser capaz de
dimensionar suas opções desde o início e certificar-se de que o tempo que você
investirá na ferramenta preferida será um tempo bem gasto. Baseado em minhas
experiências de trabalho com uma variedade de softwares de monitoramento,
elaborei uma lista que todo pacote de monitoramento em um ambiente
suficientemente complicado deve ser capaz de fazer, se corretamente
configurado.
Capacidade
de geração de Informações Gráficas
Imagine
que você esteja tentando descobrir um problema de performance em um aplicativo
Web de múltiplas camadas. Ser capaz de empilhar um monte de gráficos
aparentemente não relacionados (latência de armazenamento, transferência de
rede, transações de banco de dados por segundo, e assim por diante) e prestar
atenção na correlação entre eles pode ser tremendamente esclarecedor para
determinar a causa da lentidão.
É
de suma importância que o sistema de monitoramento tenha uma excelente
capacidade de processamento gráfico. Isso não significa apenas linhas suaves e
cores agradáveis. Se você já usou um sistema de monitoramento para solucionar
um problema de desempenho, você vai saber que a possibilidade de dar zoom,
alinhar e visualizar vários gráficos simultaneamente pode ser extremamente útil.
Fácil
supressão de eventos
Falsos
Positivos !!! A maior dor de cabeça de um sistema de monitoração ao iniciar a
sua operação, sem dúvidas diz respeito a capacidade de gerar informações
confiáveis.
Toda
vez que o celular explode com 80 alertas semelhantes, você perde a sensibilidade sobre o que o sistema
de monitoramento está querendo dizer - e o risco de perder uma advertência
importante em meio a todo esse ruído é grande. É fundamental ter a capacidade
de suprimir rapidamente eventos específicos que você sabe que não são
importantes. Ser capaz de criar paradas e janelas programadas dentro do sistema
de monitoramento pode ajudar. Também é importante
ser capaz de suprimir os eventos a partir de uma determinada fonte, quando você
sabe que a manutenção ou a atividade de atualização irá gerar erros. Estive em
várias situações em que um processo de atualização conhecido causou efeitos
secundários inesperados em outros
sistemas, mas esses efeitos não
foram observados muito mais tarde, porque os sistemas de monitoramento foram
ignorados.
Múltiplos
métodos de coleta de dados.
Você
tem uma ampla variedade de maneiras de obter informações a partir de uma
infraestrutura. Quase todo o pacote de monitoramento vai apoiar as opções
básicas, como pings ICMP para testar o tempo de atividade, SNMP para coletar
estatísticas de rede, e WMI para puxar os dados de log de eventos. São métodos
básicos usados para cobrir a grande maioria dos sistemas. No entanto, SNMP está sendo deixado de lado em favor de outras
interfaces de monitoramento e de gestão mais modernas, como WBEM e CIM. Na
verdade, muitos fabricantes estão começando a depreciar o suporte SNMP
completamente a favor de CIM.
Além
dos protocolos mais recentes substituindo SNMP, uma variedade de outros tipos
de consultas pode ser útil. Alguns exemplos podem incluir a possibilidade de
executar diretamente as consultas SQL e o tempo de sua execução ou assistir a
sua produção. Quanto mais ferramentas que você tiver na caixa de ferramentas,
mais provável será que você encontre um meio de monitorar as minúcias
importantes.
Vários
pontos de coleta de informações
A
maioria dos sistemas de monitoramento utiliza um serviço de software para fazer
o seu levantamento de dados e sondagem. Em alguns casos, este serviço de coleta
de dados é realizado pelo mesmo sistema que tem a configuração da emissão de
alertas. Outras vezes, o serviço de coleta é um produto mais especializado, e
você pode ter mais de um. Os sistemas em que você pode implantar mais de um
coletor e orquestra-los são definitivamente preferíveis àqueles em que você não
pode.
Há duas razões principais para
isso. Uma delas é que você pode ser capaz de construir alguma redundância no
caso de um coletor ser afetado por um desastre. Outra é que ter múltiplas
visões do mesmo item pode ser muito útil. WANs maiores podem se beneficiar de
ter coletores instalados em cada local para que um problema com toda a rede
possa ser diferenciado de um problema em um único local.
Facilidade
de integração e extensão
Não
importa o que o seu sistema de monitoramento é PAGO, ou um FREEWARE, a
habilidade de estendê-lo ou integrá-lo com outros sistemas pode, eventualmente,
significar a diferença entre a necessidade de substituí-lo e preservar todo o
tempo que você investiu nele. Embora muitos sistemas de monitoramento sejam
muito bons no que fazem, eles não podem ser bons em tudo. Às vezes, a única
maneira de obter a informação que você precisa é programar uma solução ou usar
uma ferramenta diferente. Nessas situações, a capacidade de estender ou
integrar o pacote de monitoramento para trabalhar com outros softwares é
fundamental.
No final do dia, a escolha de
qual aplicativo de monitoramento deve ser usado vai depender do que você quer realizar.
Alguns serão melhores no monitoramento de ambientes predominantemente Linux, em
vez de ambientes Windows. Alguns são melhores em redes, infraestrutura de
aplicações e bancos de dados, o importante é que você tenha uma ferramenta que
possa contribuir para que seu dia seja mais tranquilo e assertivo nos momentos
críticos.