Especialista em monitoramento, ferramentas de observabilidade "Datadog"
Brazil
GU7 – Prod_GU7 /
Homeoffice /
Remote
Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 7.400 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1.000 clientes durante nossos 30 anos de história. Inteligência Artificial é nossa realidade.
Importante: posições localizadas na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequência vigente.
Estamos em busca de um(a) Especialista em Observabilidade e Monitoramento que atue diretamente em performance e disponibilidade de sistemas complexos. Se você possui expertise em monitoramento ponta a ponta, é craque em Datadog e tem experiência em transição de ferramentas de APM, essa é a sua oportunidade!
Você será fundamental na construção e evolução de nossa estratégia de observabilidade, com foco na migração de Dynatrace para Datadog e na otimização contínua de nossas plataformas de monitoramento.Responsabilidades
Liderar a estratégia e implementação de observabilidade: Ser a referência técnica para a implementação, configuração e otimização de soluções de monitoramento e observabilidade, com foco principal em Datadog.
Migração e consolidação de ferramentas: Atuar ativamente na migração de ambientes e funcionalidades de monitoramento do Dynatrace para o Datadog, garantindo uma transição suave e eficiente.
Desenvolvimento de dashboards e alertas: Projetar, construir e manter dashboards, monitors e alertas robustos no Datadog para garantir a visibilidade proativa da performance e disponibilidade dos sistemas, identificando gargalos e anomalias.
Otimização de coleta de dados: Garantir a coleta eficiente e relevante de métricas, logs e traces (APM) para fornecer uma visão abrangente da saúde das aplicações e infraestrutura.
Análise e troubleshooting: Utilizar dados de observabilidade para diagnosticar e resolver proativamente incidentes, problemas de performance e auxiliar equipes de desenvolvimento e operações na identificação de causas-raiz.
Gestão de logs e eventos: Implementar e otimizar a ingestão, processamento e análise de logs para facilitar a detecção e resolução de problemas, utilizando ferramentas como Datadog Logs.
Automação e IaC para observabilidade: Apoiar a criação e manutenção de Infraestrutura como Código (IaC) para a gestão de configurações de monitoramento (ex: Terraform para Datadog).
Colaboração e capacitação: Trabalhar em estreita colaboração com times de desenvolvimento, SRE e operações, capacitando-os no uso das ferramentas de observabilidade e promovendo uma cultura de "ownership" da saúde dos serviços.
Melhoria contínua: Participar ativamente de rituais ágeis (Daily, Planning, Retrospectivas), contribuindo com insights para aprimorar os processos de monitoramento e a entrega de valor.
Requisitos Essenciais
Experiência comprovada em Datadog: Domínio na criação e gestão de monitors, dashboards, alertas e notebooks no Datadog. Experiência avançada com Datadog APM, Metrics, Logs e Synthetic Monitoring.
Experiência com migração de APM: Histórico comprovado de atuação em projetos de migração de ferramentas de Application Performance Monitoring (APM), preferencialmente de Dynatrace para Datadog.
Conhecimento em plataformas de Observabilidade: Sólida experiência com conceitos de observabilidade (métricas, logs, traces) e ferramentas relacionadas (ex: Prometheus, Grafana, OpenTelemetry, Jaeger).
Cloud Computing (AWS): Experiência na administração e monitoramento de ambientes em nuvem AWS.
IaC para Monitoramento: Familiaridade com Infraestrutura como Código (ex: Terraform) para gerenciar configurações de monitoramento.
Análise e Resolução de Problemas: Forte capacidade analítica para identificar, investigar e solucionar problemas complexos de performance e disponibilidade.
Proatividade e Colaboração: Senso de dono, proatividade para propor e implementar melhorias, e espírito colaborativo para trabalhar em equipe e compartilhar conhecimento.
Desejável
Experiência com outros serviços AWS voltados para observabilidade (CloudWatch, X-Ray).
Conhecimento em OpenTelemetry para instrumentação de aplicações.
Familiaridade com ferramentas de gestão de projetos como Jira.
Nossos benefícios:
- Plano de saúde e odontológico;
- Vale alimentação e refeição;
- Auxílio-creche;
- Licença parental estendida;
- Parceria com academias e profissionais de saúde e bem-estar via Wellhub (Gympass) TotalPass;
- Participação nos Lucros e Resultados (PLR);
- Seguro de Vida;
- Plataforma de aprendizagem contínua (CI&T University);
- Clube de descontos;
- Plataforma online gratuita dedicada à promoção da saúde física, mental e bem-estar;
- Curso gestante e parentalidade responsável;
- Parceria com plataformas de cursos online;
- Plataforma para aprendizagem de idiomas;
- E muitos outros
Mais detalhes sobre os nossos benefícios aqui: https://ciandt.com/br/pt-br/carreiras
Na CI&T, a inclusão começa no primeiro contato. Se você é pessoa com deficiência, é importante apresentar o seu laudo durante o processo seletivo. Assim, podemos garantir o suporte e as adaptações que você merece. Se ainda não tem o laudo caracterizador, não se preocupe: podemos te apoiar para obtê-lo.
Temos um time dedicado de Saúde e Bem-estar, especialistas em inclusão e grupos de afinidade que estarão com você em todas as etapas. Conte com a gente para fazer essa jornada lado a lado.