Observability

Observability: quais os benefícios já consolidados no mercado?

A capacidade de estimar com precisão o estado de sistemas por meio da “simples” avaliação de seus outputs está cada vez mais visada para lidar com a complexidade da TI. O conceito por trás desse poder é o de observability.

Um dos motivos pelos quais a disciplina está na mira das empresas é a migração para a cloud e tecnologias que vêm junto com ela, como microsserviços, contêineres e arquitetura serverless. A gestão de infraestrutura híbrida e multicloud elevou os desafios das organizações de monitorar sua operação de TI.

Em ambientes tão complexos e distribuídos, sujeitos a inúmeros tipos de falhas – conhecidas e desconhecidas –, as ferramentas de monitoramento já consolidadas não proporcionam a visibilidade e, consequentemente, o controle que as empresas precisam.

A concordância sobre esse gargalo tem alçado a observability à disciplina. Mas, se o termo não é novo na TI, a compreensão dele enquanto disciplina que visa olhar para dentro de um sistema a partir de seus outputs ainda é.

Isso levanta algumas dúvidas: de um lado, temos entusiastas que superestimam os poderes da disciplina, e de outro temos os céticos que a veem como mais uma buzzword.

Então, a pergunta é: quais os benefícios que as empresas que já praticam a observability em algum grau de maturidade estão colhendo?

É o que veremos neste artigo.

Banner-Ebook-Observability

A demanda por observability: performance, complexidade e custos das falhas 

A observability ganha corpo na esteira do uso da cloud. De acordo com o The State of Observability 2022, da Splunk, 75% dos entrevistados rodam seu ecossistema em ambientes on-premise e multicloud. Destes, boa parte espera aumentar a proporção de aplicações cloud-native nos próximos 12 meses.  

Apesar de haver vários níveis de maturidade nessa jornada para a cloud, a regra é o aumento da complexidade e dos custos de possíveis falhas.

De acordo com o mesmo estudo, o custo de quedas de aplicações desenvolvidas internamente pode ser alto para quem ainda tem baixa visibilidade sobre seus sistemas e infraestrutura, girando em torno de $ 23,8 M por ano.

Tais custos estão longe de ser apenas financeiros, afetando, de acordo com a pesquisa, a satisfação dos clientes e a reputação da empresa.

A demanda é por resiliência, disponibilidade, usabilidade e performance das aplicações, mas também por uma operação mais moderna

 

Como as empresas estão implementando a observability

É praticamente impossível encontrar duas práticas idênticas em observability, mas, de acordo com dados da pesquisa da Splunk citada acima, já é possível identificar alguns padrões em termos de ferramentas, fornecedores, adoção de AIOps, entre outros. 

As organizações geralmente optam por uma mistura de ferramentas desenvolvidas por conta própria e opções de mercado ou open source. As mais populares são as ferramentas fornecidas pelo CSPs, aplicadas a seu respectivo ambiente naquele provedor. O volume médio de ferramentas gira em torno de 7 a 15.

Os toolkits são compostos por alguns recursos básicos para chegar à observability:

  • Ferramentas de coleta dos dados, seja de fontes como contêineres, aplicações, serviços ou outros;
  • Ferramentas que processam esses dados e os correlacionam, estabelecendo um contexto para eles e viabilizando uma espécie de curadoria de dados;
  • Ferramentas de AIOps para agregar, correlacionar e priorizar incidentes; e
  • Ferramentas de resposta a incidentes, para gerenciar o tratamento de falhas e ações preventivas.

 

Benefícios da observability: segurança, performance e economia

De acordo com os achados do levantamento da Splunk no The State of Observability, os resultados da prática são os melhores

A observability tem o benefício de unir a visibilidade sobre o que está acontecendo à possibilidade de consertar as coisas mais rápido – inclusive antes de que gerem um incidente crítico com impacto significativo para o negócio. 

Livre de toda a dedicação à manutenção de seus recursos em funcionamento, a TI torna-se capaz de ter um delivery mais rápido, além de mais bem-sucedido, assim como um melhor alinhamento entre as equipes

Com isso, as equipes também confiam mais em sua capacidade de proporcionar uma experiência digital boa, de criar aplicações resilientes e com bom desempenho.

A maturidade em observability é fonte de benefícios ainda maiores, de acordo com a Splunk. Os dados do levantamento mostram que empresas que já alcançaram maturidade em observability desenvolvem e implementam mais do que as que ainda estão iniciando. Elas afirmam 2,1 vezes mais do que as iniciantes colocar todo o código desenvolvido em produção. 

Ainda que coloquem mais código em produção, praticantes maduros afirmam que quedas são menos comuns. Mesmo assim, quando elas acontecem, equipes maduras em observability afirmam 2,1 vezes mais que iniciantes poder detectar em minutos esses incidentes.

A resposta a incidentes acontece mais rapidamente também: os pioneiros em observability afirmam duas vezes mais que os iniciantes (53% vs. 27%) resolver quedas não planejadas ou degradações sérias em aplicações internas em menos de quatro horas.

Quanto ao custo das falhas, enquanto iniciantes ainda têm que lidar, em média, com um passivo de $ 23,8 M anuais, líderes diminuem esse montante para $ 2,5 M em média.

 

O futuro da observability: convergência com equipes e ferramentas de monitoramento

Os benefícios da observability encontrados pelas organizações que já implementaram práticas, sobretudo para as que já alcançaram a maturidade, é a convergência entre a disciplina e outras soluções mais bem estabelecidas de monitoramento e gestão da performance de aplicações.

Para citar alguns dados da Splunk:

  • APM e observability já convergiram em 22% das empresas e 55% estão no processo ou vão fazer.
  • Monitoramento da experiência digital: 23% já convergiram com observability, enquanto 50% estão com a fusão em andamento ou prevista.
  • Monitoramento de infraestrutura: 24% já uniram equipe e ferramentas às de observability, e 55% estão no processo ou vão começar.
  • Gestão de log: 22% já uniram o processo à observability, e 51% estão fazendo ou vão fazer.

A observability também deve ser viabilizada por frameworks como a OpenTelemetry. Apesar de estar em seus estágios iniciais, o projeto de código aberto fornece um conjunto de ferramentas, APIs e SDKs para capturar métricas, rastreamentos distribuídos e logs de aplicativos, oferecendo recursos para a criação de plataformas de observability. 

 

Desafios em observability

Nem tudo é panaceia. As organizações têm várias dificuldades em implementar e manter a observability. Entre as principais citadas pelos entrevistados pela Splunk estão:

  • Dificuldade de correlacionar dados de múltiplas fontes rapidamente;
  • Coleta de volumes de dados que excedem a capacidade humana de interpretação;
  • Falta de visibilidade sobre ambientes distribuídos;
  • Uso de ferramentas legadas sem visibilidade sobre ambientes cloud-nativos;
  • Uso de ferramentas de observability sem visibilidade sobre ambientes de aplicações legadas;
  • Dificuldade de escalar as iniciativas em observability;
  • Dificuldade de chegar à causa raiz de problemas e incidentes; e
  • Dificuldade de contratar profissionais na área.

 

Observability nas organizações: a evolução continua

Para além do hype, a observability tem mostrado os seus benefícios, sobretudo para os early adopters, que embarcaram na jornada há algum tempo e puderam amadurecer seus processos, ferramentas e equipes. 

Isso não significa que a disciplina em si esteja madura. Ela segue em expansão, passo a passo com a adesão continuada à cloud e à pressão por melhorar a performance das aplicações.

A necessidade é real e continuará a impulsionar a área, com mais fornecedores e tecnologias entrando na arena competitiva. O mercado agradece.

Quer saber como fazer observability na sua empresa? Entre em contato conosco!

Explore conteúdos relacionados:

Observability

4 vantagens imediatas da observability para o negócio

Observability

Synthetic monitoring: 7 razões para considerar essa ferramenta