SRE Engineer (Observability)
Efetivo
Remoto
Vaga também para PcD
Descrição da vaga
🔎 #Conheça um pouco sobre a área:
O propósito da squad de SRE é prover serviços da nossa plataforma de Growth Intelligence em ambientes de produção na AWS com a maior confiabilidade e resiliência possível, apoiando squads de desenvolvimento e dados, promovendo a cultura DevOps.
Aqui você terá como desafios a criação, gerenciamento e monitoramento da infraestrutura cloud, garantindo escalabilidade, eficiência operacional e provendo autonomia com automação para os squads de engenharia no uso de ferramentas e processos.
Além disso, você nos apoiará na evolução de uma operação e desenvolvimento orientado à observabilidade, utilizando métricas de infraestrutura, negócios e definição de níveis de serviços.
Responsabilidades e atribuições
🎯#Desafios que você vai encontrar:
- Contribuir na implementação do fluxo de desenvolvimento e operação orientado à observabilidade, adotando ferramentas, garantindo métricas de disponibilidade, desempenho e indicadores de serviço (SLI, SLO, SLA) considerando os pilares: Logs, Métricas e Tracing;
- Implementar visão de monitoramento dos Golden Signals para os principais serviços da Cortex;
- Visão holística da stack de serviços Cortex visando a melhoria contínua de nosso monitoramento/observação e como tornar ações mais proativas na resolução de problemas, antecipando-se a falhas;
- Definir estratégias e integrar ferramentas para monitoramento centralizado em dashboards para consumo dos times de desenvolvimento, suporte e SRE;
- Apoiar na definição, implementação e evolução de arquitetura cloud (AWS) da plataforma Cortex, considerando boas práticas de deploy, infraestrutura como código (IAC), pipelines (CI/CD), monitoramento, performance e escalabilidade;
- Entender necessidades dos squads de engenharia, garantindo requisitos de operação, apoiando na evolução dos ambientes de teste e desenvolvimento;
- Atuar em rotinas de troubleshoot e depuração de aplicações Cortex e serviços cloud em conjunto com squads de serviços;
- Contribuir para adoção de uma cultura devops nos squads de Engenharia;
- Garantir a qualidade e padronização das entregas através de automatização de tarefas rotineiras e operacionais, participação em postmortem, capacity planning e migrations planning.
Requisitos e qualificações
✔️ #Conhecimentos importantes para a posição:
- Experiência na implementação e uso de ferramentas de monitoria e observação como: Datadog, X-Ray, Grafana, Graylog, Prometheus, OpenTelemetry, Stack ELK;
- Entende e aplica diariamente os conceitos de observabilidade no desenvolvimento e implementação de infraestrutura, trazendo a visão de performance e disponibilidade dos nossos microsserviços.
- Experiência na evolução e monitoramento de pipelines de CI/CD;
- Integração e configuração de serviços como: GitHub Actions, ECS, Kubernetes;
- Experiência com ambientes, arquiteturas e serviços cloud na Amazon Web Services (AWS);
- Experiência com ferramentas de gerenciamento de configurações, automação e infraestrutura como código (Ansible, Terraform);
- Bons conhecimentos em Linux (Amazon Linux, CentOS, Debian);
- Habilidade com programação de scripts (Bash, Python) para automação de tarefas e resolução de problemas de operação;
- Ter proficiência em gestão de containers;
- Boas práticas de gestão e versionamento de código (GIT);
- Consegue traduzir para requisitos/processos de operação uma entrega em produção ou manutenção do ciclo de vida de um microsserviço, considerando planejamento da entrega, escalabilidade, deploy, rollback etc…
- Aplica em seu dia-dia e consegue promover a cultura DevOps nos squads de engenharia;
- Utiliza métricas para apoio na resolução de problemas de performance e escalabilidade;
⭐ #Diferencial para a posição:
- Experiência na implementação de ferramentas opensource para coleta e consumo de métricas de infraestrutura e aplicações em sistemas altamente distribuídos;
- Gerenciamento de clusters ELK (Elastic, Logstash, Kibana) com alta disponibilidade;
- Já atuou em iniciativas conjuntas de teste de carga de sistemas com foco nas definições de limites de uso, thresholds e melhoria de monitoração;
- Planejamento e execução de Disaster Recovery Plan (DRP) em ambientes críticos.
Informações adicionais
💜 #PraVocê Nossos Beneficios:
PraVocê no dia a dia 🌞:
- Vale Refeição ou Alimentação;
- Gympass;
- Auxílio home-office (durante a pandemia);
- Auxílio infraestrutura (durante a pandemia);
- Flexibilidade de horários e locações.
PraVocê & Família👩👩👧👦:
- Plano de Saúde e Plano Odontológico SulAmérica;
- Auxílio-creche (até os 5 anos completos da criança);
- Licença-Maternidade, Paternidade e Adotante Estendidas (#todasasfamíliasimportam);
- Seguro de Vida;
- Day Off de Aniversário (Um dia de folga para tirar no dia ou durante o mês do seu aniversário.);
- Dia da Família (Um dia de folga para tirar entre os meses de maio e agosto e aproveitar como quiserem.);
- Pausa Mental (Uma semana corrida de folga em JANEIRO para que descansem e recarreguem as baterias.).
PraVocê AINDA MAIS🔝:
● Senso de propósito ao fazer parte de um time que está construindo algo que será perene e trará frutos para a sociedade, seja a Cortex em si enquanto "startup" em rápido crescimento que gerará cada vez mais empregos, seja o produto Plataforma Cortex, que será usado por cada vez mais usuários no Brasil e exterior.
● Ambiente de trabalho descontraído, jovem, empreendedor e meritocrático, sem espaço para política.. ;-)
● Oportunidade de desenvolvimento de carreira e crescimento numa empresa que não para de crescer.
Valorizamos, cultivamos e respeitamos as diferenças, por isso proporcionamos um ambiente aberto e inclusivo.
Todas as nossas posições são elegíveis para pessoas com deficiência.
Tecnológica, inquieta e ousada, bem-vindo à Cortex!🚀
Somos a Cortex, a plataforma brasileira líder em inteligência de Go-To-Market e o maior investimento em Inteligência Artificial aplicada a negócios na América Latina. Nosso propósito é transformar com inteligência o caminho de pessoas e negócios.
Usamos IA e Ciência de Dados para promover uma gestão completa e contínua do Go-to-Market de marcas líderes no país. Nossa plataforma é a única que coleta e normaliza dados externos, sejam eles firmográficos, de mídia ou de localização, e os unifica com dados internos de clientes para criar painéis de analytics flexíveis, análises geográficas e fluxos de trabalho baseados em dados.
Grandes investidores acreditam no nosso negócio. Temos como parceiros alguns dos maiores e principais fundos de investimento em tecnologia, como Lightrock, Riverwood Capital e SoftBank.
VEM FAZER PARTE DO TIME!
Aqui na Cortex você encontrará um ambiente receptivo às diferenças e às necessidades das pessoas. Crescemos rápido porque crescemos juntos.
Tudo isso faz com que ser cortexiane seja uma experiência única de descobertas, transformação e crescimento a partir de um ambiente colaborativo de criação e realização. Vamos juntos?
Então aproveite e conheça a Jornada Cortex da Pessoa Candidata. Você encontrará tudo sobre o nosso processo seletivo, dicas sobre cada etapa e nossa história e cultura:
Acesse aqui 👉 https://bit.ly/3LpUx0i
#BeCortex
Conheça mais sobre nós 🚀