Pular para o conteúdo principal

SRE Engineer (Observability)

Modelo de trabalho íconeEfetivo

Trabalho Remoto íconeRemoto

Ícone de accessibilidadeVaga também para PcD

Descrição da vaga

 🔎 #Conheça um pouco sobre a área:


 O propósito da squad de SRE é prover serviços da nossa plataforma de Growth Intelligence em ambientes de produção na AWS com a maior confiabilidade e resiliência possível, apoiando squads de desenvolvimento e dados, promovendo a cultura DevOps. 


 Aqui você terá como desafios a criação, gerenciamento e monitoramento da infraestrutura cloud, garantindo escalabilidade, eficiência operacional e provendo autonomia com automação para os squads de engenharia no uso de ferramentas e processos.


 Além disso, você nos apoiará na evolução de uma operação e desenvolvimento orientado à observabilidade, utilizando métricas de infraestrutura, negócios e definição de níveis de serviços.

Responsabilidades e atribuições

🎯#Desafios que você vai encontrar:


  • Contribuir na implementação do fluxo de desenvolvimento e operação orientado à observabilidade, adotando ferramentas, garantindo métricas de disponibilidade, desempenho e indicadores de serviço (SLI, SLO, SLA) considerando os pilares: Logs, Métricas e Tracing;
  • Implementar visão de monitoramento dos Golden Signals para os principais serviços da Cortex;
  • Visão holística da stack de serviços Cortex visando a melhoria contínua de nosso monitoramento/observação e como tornar ações mais proativas na resolução de problemas, antecipando-se a falhas;
  • Definir estratégias e integrar ferramentas para monitoramento centralizado em dashboards para consumo dos times de desenvolvimento, suporte e SRE;
  • Apoiar na definição, implementação e evolução de arquitetura cloud (AWS) da plataforma Cortex, considerando boas práticas de deploy, infraestrutura como código (IAC), pipelines (CI/CD), monitoramento, performance e escalabilidade;
  • Entender necessidades dos squads de engenharia, garantindo requisitos de operação, apoiando na evolução dos ambientes de teste e desenvolvimento;
  • Atuar em rotinas de troubleshoot e depuração de aplicações Cortex e serviços cloud em conjunto com squads de serviços;
  • Contribuir para adoção de uma cultura devops nos squads de Engenharia;
  • Garantir a qualidade e padronização das entregas através de automatização de tarefas rotineiras e operacionais, participação em postmortem, capacity planning e migrations planning.

Requisitos e qualificações

✔️ #Conhecimentos importantes para a posição:


  • Experiência na implementação e uso de ferramentas de monitoria e observação como: Datadog, X-Ray, Grafana, Graylog, Prometheus, OpenTelemetry, Stack ELK;
  • Entende e aplica diariamente os conceitos de observabilidade no desenvolvimento e implementação de infraestrutura, trazendo a visão de performance e disponibilidade dos nossos microsserviços.
  • Experiência na evolução e monitoramento de pipelines de CI/CD;
  • Integração e configuração de serviços como: GitHub Actions, ECS, Kubernetes;
  • Experiência com ambientes, arquiteturas e serviços cloud na Amazon Web Services (AWS);
  • Experiência com ferramentas de gerenciamento de configurações, automação e infraestrutura como código (Ansible, Terraform);
  • Bons conhecimentos em Linux (Amazon Linux, CentOS, Debian);
  • Habilidade com programação de scripts (Bash, Python) para automação de tarefas e resolução de problemas de operação;
  • Ter proficiência em gestão de containers;
  • Boas práticas de gestão e versionamento de código (GIT);
  • Consegue traduzir para requisitos/processos de operação uma entrega em produção ou manutenção do ciclo de vida de um microsserviço, considerando planejamento da entrega, escalabilidade, deploy, rollback etc…
  • Aplica em seu dia-dia e consegue promover a cultura DevOps nos squads de engenharia;
  • Utiliza métricas para apoio na resolução de problemas de performance e escalabilidade;

#Diferencial para a posição:


  • Experiência na implementação de ferramentas opensource para coleta e consumo de métricas de infraestrutura e aplicações em sistemas altamente distribuídos;
  • Gerenciamento de clusters ELK (Elastic, Logstash, Kibana) com alta disponibilidade;
  • Já atuou em iniciativas conjuntas de teste de carga de sistemas com foco nas definições de limites de uso, thresholds e melhoria de monitoração;
  • Planejamento e execução de Disaster Recovery Plan (DRP) em ambientes críticos.

Informações adicionais

💜 #PraVocê Nossos Beneficios:


PraVocê no dia a dia 🌞:

  • Vale Refeição ou Alimentação; 
  • Gympass; 
  • Auxílio home-office (durante a pandemia); 
  • Auxílio infraestrutura (durante a pandemia); 
  • Flexibilidade de horários e locações.

PraVocê & Família👩‍👩‍👧‍👦:

  • Plano de Saúde e Plano Odontológico SulAmérica; 
  • Auxílio-creche (até os 5 anos completos da criança); 
  • Licença-Maternidade, Paternidade e Adotante Estendidas (#todasasfamíliasimportam); 
  • Seguro de Vida;
  • Day Off de Aniversário (Um dia de folga para tirar no dia ou durante o mês do seu aniversário.);
  • Dia da Família (Um dia de folga para tirar entre os meses de maio e agosto e aproveitar como quiserem.);
  • Pausa Mental (Uma semana corrida de folga em JANEIRO para que descansem e recarreguem as baterias.).

PraVocê AINDA MAIS🔝:


● Senso de propósito ao fazer parte de um time que está construindo algo que será perene e trará frutos para a sociedade, seja a Cortex em si enquanto "startup" em rápido crescimento que gerará cada vez mais empregos, seja o produto Plataforma Cortex, que será usado por cada vez mais usuários no Brasil e exterior. 


● Ambiente de trabalho descontraído, jovem, empreendedor e meritocrático, sem espaço para política.. ;-) 


● Oportunidade de desenvolvimento de carreira e crescimento numa empresa que não para de crescer.


Valorizamos, cultivamos e respeitamos as diferenças, por isso proporcionamos um ambiente aberto e inclusivo.

Todas as nossas posições são elegíveis para pessoas com deficiência.

Tecnológica, inquieta e ousada, bem-vindo à Cortex!🚀

Somos a Cortex, a plataforma brasileira líder em inteligência de Go-To-Market e o maior investimento em Inteligência Artificial aplicada a negócios na América Latina. Nosso propósito é transformar com inteligência o caminho de pessoas e negócios.


Usamos IA e Ciência de Dados para promover uma gestão completa e contínua do Go-to-Market de marcas líderes no país. Nossa plataforma é a única que coleta e normaliza dados externos, sejam eles firmográficos, de mídia ou de localização, e os unifica com dados internos de clientes para criar painéis de analytics flexíveis, análises geográficas e fluxos de trabalho baseados em dados.


Grandes investidores acreditam no nosso negócio. Temos como parceiros alguns dos maiores e principais fundos de investimento em tecnologia, como Lightrock, Riverwood Capital e SoftBank.


VEM FAZER PARTE DO TIME!


Aqui na Cortex você encontrará um ambiente receptivo às diferenças e às necessidades das pessoas. Crescemos rápido porque crescemos juntos.


Tudo isso faz com que ser cortexiane seja uma experiência única de descobertas, transformação e crescimento a partir de um ambiente colaborativo de criação e realização. Vamos juntos?


Então aproveite e conheça a Jornada Cortex da Pessoa Candidata. Você encontrará tudo sobre o nosso processo seletivo, dicas sobre cada etapa e nossa história e cultura:


Acesse aqui 👉 https://bit.ly/3LpUx0i

#BeCortex



?