Especialista SRE - Datadog
São Paulo
Tecnologia – Infra Cloud SRE /
Efetivo /
Remote
Somos um dos maiores bancos privados do Brasil, conforme o ranking do Banco Central. E temos muito orgulho em dizer que, pelo segundo ano consecutivo, fomos reconhecidos como a melhor instituição financeira para trabalhar no Brasil, segundo o ranking da GPTW 2025! Também recebemos o selo de Diversidade na categoria Mulher, reforçando nosso compromisso com a equidade.
Nossa cultura acontece de verdade: sendo simples, corretos, parceiros e corajosos. Valorizamos as relações, a inovação e um ambiente leve, cada vez mais colaborativo e com intencionalidade no avanço da diversidade e inclusão.
Estamos em constante evolução e construímos #parcerias de sucesso para entregarmos nosso propósito de tornar mais tranquila a vida financeira de pessoas e empresas.
Se identificou? Então venha trabalhar com a gente!
sobre a área:
- O time SRE responsável por garantir a visibilidade continua dos os sistemas e aplicações da organização. Utilizando praticas SRE, mapeando jornadas criticas, construindo SLIs e SLOs e atuando na configuração, manutenção e evolução da plataforma de observabilidade, coletando logs, métricas e traces, e utilizando mecanismos de inteligência artificial para a rápida detecção de falhas e o diagnostico preciso de problemas, assim direcionando as tomadas de decisão baseadas em dados.
Dá uma olhada nos desafios que te esperam aqui no BV:
- Definir a arquitetura de Observabilidade;
- Estabelecer KPIs, SLOs, SLIs e SLAs;
- Mapeamento de Jornadas Criticas;
- Governança de Observabilidade;
- Manter e evoluir Politicas e guardrails;
- Aculturamento praticas SRE;
- Criar e Manter Documentação do time;
- Projetos e Migração;
- Instrumentar Sistemas (Coletas Log, Trace e Métricas);
- Integrar ferramentas com a stack de observabilidade;
- Criar dashboards padronizados ( Datadog e ELK);
- Auxiliar no Tshoot de Aplicações;
- Auxiliar na identificação de gargalos de aplicações e recomendar selfhealings;
- Definir e implementar Monitores padrões (Datadog e ELK);
- Identificar padrões e tendencias de mercado em praticas SRE e ferramentas de observabilidade;
- Apoiar decisões Estratégicas;
- Acompanhar o Consumo de Licenças das ferramentas;
- Otimizar o Consumo de Licenças das ferramentas;
- Explorar novas features;
- Atuação na resolução de issues de Auditoria;
- Definir Rules de acesso nas ferramentas Datadog e Elastic;
- Fazer a Gestão dos Grupos de Administradores do Datadog e Elastic.
E aí, se identificou? Agora gostaríamos de saber se você tem o perfil e os conhecimentos abaixo:
- Observabilidade & Monitoramento
- Cloud & Infraestrutura
- Resiliência & Performance
- Ferramentas & Linguagens
- Idiomas
• Domínio avançado de Datadog: criação de dashboards, alertas, monitoramento de serviços, logs e APM
• Integração de Datadog com serviços cloud (AWS, Azure, GCP)
• Otimização de custos e performance de agentes Datadog
• Experiência com OpenTelemetry e coleta de métricas customizadas
• Experiencia em SO Windows/Linux/Solaris
• Proficiência em GCP , Azure e AWS
• Infraestrutura como código com Terraform
• Contêineres e orquestração com Docker e Kubernetes
• Gerenciamento de CI/CD Spinnaker, Jenkins
• Implementação de chaos engineering e testes de falha
• Análise de incidentes e postmortems com foco em melhoria contínua
• Otimização de tempo de resposta e throughput de aplicações
• Linguagens: Python, Go, Java, Shell Script
• Ferramentas: Datadog, Prometheus, Grafana, ELK Stack, Ansible, BitBucket
• Automação de tarefas com scripts e pipelines
• Ingles Fluente (Desejavel)
Diversidade e inclusão
O BV atua intencionalmente em prol da aceleração da equidade e representatividade no mercado financeiro, respeitando e apoiando a diversidade em toda sua pluralidade e interseccionalidade, garantindo uma transformação social positiva.
Por isso, convidamos pessoas negras, mulheres, profissionais com deficiência, comunidade LGBTQIA+ e pessoas de qualquer idade a conhecerem a gente um pouco mais e a se inscreverem nesta vaga.