Job Openings Site Reliability Engineer

About the job Site Reliability Engineer

Estamos a contratar: Site Reliability Engineer

Localização: Lisboa, Porto, Coimbra, Covilhã, Guarda, Castelo Branco

Estás pronto para fazer crescer a tua carreira num ambiente dinâmico e colaborativo? Estamos à procura de um Site Reliability Engineer para se juntar à nossa equipa.

Estamos à procura de um Site Reliability Engineer (SRE) para integrar uma equipa dinâmica e multidisciplinar. Se tens paixão por garantir sistemas escaláveis, fiáveis e seguros, esta oportunidade é para ti!

Sobre a Oportunidade:

Como SRE, serás responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, garantindo a fiabilidade, desempenho e escalabilidade de sistemas em produção. Irás colaborar diretamente com equipas de desenvolvimento com foco na adoção de práticas de fiabilidade, sempre alinhado com os objetivos de negócio e a experiência do cliente.

Responsabilidades:

  • Liderar e apoiar equipas no cumprimento de princípios e práticas de fiabilidade;

  • Definir e manter SLOs (Service Level Objectives) e SLAs (Service Level Agreements);

  • Desenhar e implementar infraestruturas escaláveis e resilientes, com foco em segurança e boas práticas cloud-native;

  • Trabalhar em estreita colaboração com equipas de desenvolvimento para garantir sistemas observáveis, tolerantes a falhas e de elevada performance;

  • Implementar soluções de monitorização, alertas, logging e tracing;

  • Coordenar a resposta a incidentes, assegurando resolução rápida e eficaz, com análise de causa raiz (RCA);

  • Automatizar tarefas operacionais, com foco na deteção e recuperação rápida de falhas;

  • Promover uma cultura de melhoria contínua e partilha de conhecimento;

  • Comunicar com stakeholders sobre a fiabilidade e performance dos sistemas;

  • Participar em regimes de on-call para suporte a sistemas em produção.

O que Procuramos:

  • Licenciatura em Engenharia Informática, Ciência da Computação ou áreas similares;

  • Mínimo de 5 anos de experiência em desenvolvimento de software e/ou operações;

  • Domínio de, pelo menos, uma linguagem de programação (Python, Java, C#, etc.);

  • Excelentes capacidades de troubleshooting e resolução de problemas;

  • Fluência em inglês e forte capacidade de comunicação;

  • Pensamento orientado a processos e capacidade de negociação em contextos técnicos.

Competências Técnicas Valorizadas:

  • Definição e monitorização de SLOs, SLIs e SLAs;

  • Experiência com Kubernetes, EKS, e tecnologias de containerização (certificações CKA/CKAD/CKS são uma mais-valia);

  • Conhecimentos de ferramentas de IaC (Terraform, CloudFormation, Puppet, etc.);

  • Experiência em scripting com Python, Go ou Bash;

  • Familiaridade com serviços AWS (EC2, RDS, ELB, Lambda, etc.);

  • Monitorização com Grafana, ELK, Prometheus ou similares;

  • Capacidade de desenhar sistemas distribuídos, resilientes e tolerantes a falhas.

O que Oferecemos:

  • Ambiente de trabalho colaborativo, dinâmico e tecnológico;

  • Participação em projetos inovadores com impacto local e internacional;

  • Oportunidades de crescimento e aprendizagem contínua;

  • Remuneração ajustada à experiência e performance individual.