Voltar para todas as vagas

Principal Data Engineer

TecnologiaBelo Horizonte/MGHíbrido

Sobre a vaga

Responsável por construir e operar a espinha dorsal de dados de um produto digital de saúde de alto impacto, onde a IA é parte central da solução. Com perfil hands on e forte senioridade técnica, projeta pipelines robustos, garante a qualidade e a governança dos dados que alimentam modelos inteligentes e colabora de perto com os times de engenharia e IA, seguindo os mais altos padrões de segurança e conformidade do setor de saúde.

Como Arquiteto(a) de Dados, é também responsável por toda a operação de engenharia de dados da companhia, definindo a arquitetura das plataformas de dados (Data Lake, Lakehouse e Data Warehouse) e a governança e a segurança da informação. Neste papel, você não apenas executa — você define o caminho. Esperamos alguém que já construiu produtos de dados de longo prazo em escala real, que tenha vivência com decisões estratégicas de arquitetura que impactaram múltiplos times e produtos simultaneamente, e que traga a maturidade técnica para orientar e elevar o nível de toda a frente de dados da companhia.

Atuação prática

  • Projetar, construir e manter pipelines de dados robustos (ETL/ELT) que alimentam modelos clássicos de ML e sistemas RAG e LLMs em produção.
  • Garantir qualidade, governança e rastreabilidade de dados com data contracts, catalogação e versionamento de datasets e artefatos.
  • Estruturar e operar plataformas de MLOps: feature stores, model registry, experiment tracking, serving e monitoramento de performance.
  • Implementar retreinamento contínuo, drift detection e critérios de promoção e rollback de modelos por métricas técnicas e de negócio.
  • Integrar pipelines de dados e ML em fluxos CI/CD, com reprodutibilidade e rastreabilidade de experimentos.
  • Estabelecer observabilidade de dados: tracing, logs, métricas de qualidade e alertas de degradação.
  • Apoiar o time de IA na construção de pipelines RAG: ingestão, chunking, indexação, embeddings e buscas híbridas.
  • Garantir conformidade com LGPD e normas de saúde, com mascaramento de dados, gestão de PII e segurança by design.
  • Definir a estratégia técnica de dados da companhia com visão de longo prazo, considerando escalabilidade, impacto de negócio e evolução da plataforma como um todo.
  • Atuar de forma transversal, influenciando decisões de arquitetura em múltiplos produtos e times simultaneamente.
  • Servir de referência técnica para os demais engenheiros de dados, apoiando decisões complexas e desbloqueando problemas de alta ambiguidade.

Requisitos

  • Experiência sólida como Data Engineer em produtos digitais de alta escala.
  • Domínio de Python para engenharia de dados e pipelines de ML.
  • Cloud (Azure, AWS ou GCP) e orquestração de pipelines (Airflow, Prefect ou equivalentes).
  • Plataformas de MLOps (MLflow, Databricks, SageMaker ou similares).
  • Bancos SQL, NoSQL e vetoriais e mensageria/eventos (Kafka, RabbitMQ ou equivalentes).
  • Familiaridade com LLMs em produção e sistemas RAG.
  • Segurança de dados, mascaramento de PII e conformidade com LGPD e normas de saúde.
  • Histórico comprovado de decisões de arquitetura de dados com impacto em escala — produtos com alto volume de dados, múltiplos domínios ou contextos de alta regulação.
  • Experiência com gestão técnica: mentoria de engenheiros, definição de padrões e boas práticas, ou atuação como referência técnica em times multidisciplinares.

Diferencial

  • Tracing e avaliação de pipelines RAG (Langfuse, Ragas, DeepEval ou equivalentes).
  • Busca híbrida (BM25 e densa), re-rankers e embeddings proprietários.
  • Experiência prévia em healthtech, fintech ou setores de alta regulação.
  • Contribuições open source ou comunidades de dados e IA.
  • Vivência em empresas que operam dados em ultra larga escala (ex.: fintechs, marketplaces, healthtechs de abrangência nacional).
  • Passagem por contextos onde foi o responsável por definir — não apenas executar — a estratégia de dados de uma vertical ou companhia.

Interessou por esta vaga?

Envie seu currículo e o seu perfil do LinkedIn para o nosso time, com o nome da vaga no assunto do e-mail. Vamos analisar e retornar.

Enviar e-mail para people@marisa.care