Site Reliability Engineer

São Paulo, Brazil
Engineering
Full-time
O que é a TFG?

A TFG é a maior empresa de jogos mobile da América Latina, e uma das maiores do mundo. Ao longo de sete anos, os mais de 60 títulos lançados pela empresa alcançaram mais de 1 bilhão de downloads em 115 países, com uma equipe que começou com apenas dois irmãos e hoje reúne cerca de 190 pessoas em São Paulo. A missão da TFG é ser a melhor empresa de jogos do mundo. Para isso, procuramos reunir times excepcionais em engenharia de software, arte e animação, produto, distribuição e ciência de dados.

Estamos em busca de engenheiros que serão responsáveis pelo gerenciamento, monitoramento e melhoria contínua da nossa infraestrutura de produção, dando suporte a sistemas de alta disponibilidade e escalabilidade que interagem com milhões de jogadores de todo o mundo e são cruciais para o funcionamento dos nossos jogos.

No dia a dia você trabalhará próximo dos nossos engenheiros de Backend e terá a oportunidade de contribuir com vários projetos open source altamente estimados pelo mercado, e que hoje são o núcleo de nossa infraestrutura, como: Kubernetes, Deis, Elasticsearch, Kafka, dentre outros. Você deverá entender as demandas dos nossos sistemas, diagnosticar problemas no ambiente de produção, identificar pontos de melhoria e automação e garantir que temos a infraestrutura necessária para criar os melhores jogos do mundo.

Você estará trabalhando com tecnologia de ponta e com uma equipe de altíssimo nível. Será esperado que você se mantenha sempre atualizado e também que seja autônomo e proativo para estudar e nos apresentar novas tecnologias que resolvam melhor nossos problemas.

Responsabilidades

    • Administrar, monitorar e otimizar nossos clusters de infraestrutura (Kubernetes, Elasticsearch, MongoDB, Kafka...).
    • Monitorar aplicações críticas e gerenciar incidentes em produção visando garantir a maior disponibilidade possível.
    • Identificar pontos de melhoria e/ou automação na infraestrutura de produção.
    • Garantir que estamos usando a melhor stack possível (estudar as tecnologias, testar novas soluções e medir resultados de mudanças).
    • Propor e operar pipelines de CI/CD.
    • Detectar gargalos e otimizar aplicações.

Requisitos

    • Graduação em Ciência da Computação, Engenharia de Computação ou experiência equivalente.
    • Ser curioso, proativo e buscar aprendizado constante.

Plus

    • Experiência com Docker e Kubernetes.
    • Experiência com sistemas de monitoramento (DataDog, Statsd, Grafana, etc).
    • Experiência com ferramentas de infrastructure as a code (Chef e Terraform).
    • Experiência com sistemas de mensagens como Kafka e Emqtt.
    • Experiência com gerenciamento de bancos de dados (Postgres, MongoDB, Cassandra, Redis, ElasticSearch).
    • Experiência com pipelines de CI/CD (Jenkins, Travis, etc).
    • Experiência com administração de sistemas Linux.