Overview

Experiência técnica com:

  • Python, R e desejável Redshift;
  • Experiência atuando com modelagem estatística, validação de tendências, scores, relevância, fraude, riscos, performance e resultado, manipulação de bancos de dados e otimização de algoritmos. Desenvolvimento de algoritmos de machine learning.

Requisitos e qualificações

Formação:

  • Graduação em Ciência da Computação, Engenharia de Software, Engenharia de Dados ou áreas correlatas. Pós-graduação ou certificações em áreas relevantes são desejáveis.

Experiência:

  • A partir de 7 anos de experiência profissional na área de tecnologia da informação, com pelo menos 5 anos dedicados especificamente à engenharia de dados, MLOps ou Ciência de dados.

Responsabilidades:

  • Projetar, desenvolver e manter pipelines de dados eficientes e escaláveis para coletar, processar e transformar dados brutos em formatos prontos para uso em modelos de aprendizado de máquina;
  • Garantir a qualidade, integridade e consistência dos dados ao longo de todo o ciclo de vida do ML;
  • Implementar pipelines de CI/CD (Integração Contínua/Entrega Contínua) para automação de testes, validação e implantação de modelos de ML;
  • Automatizar processos de treinamento, validação, deployment e monitoramento de modelos;
  • Configurar e gerenciar a infraestrutura necessária para suportar o ciclo de vida do ML, incluindo ambientes de desenvolvimento, teste e produção;
  • Utilizar ferramentas de gerenciamento de contêineres como Docker e Kubernetes para escalar e orquestrar modelos de ML;
  • Monitorar o desempenho dos modelos em produção e implementar alertas e métricas para identificar e resolver problemas;
  • Realizar manutenção regular dos modelos para garantir que permaneçam atualizados e eficazes;
  • Trabalhar em estreita colaboração com cientistas de dados, engenheiros de software e outros stakeholders para entender os requisitos do projeto e garantir a entrega eficaz de soluções de ML;
  • Facilitar a comunicação e a colaboração entre as equipes de desenvolvimento e operações para garantir uma integração perfeita;
  • Implementar práticas de gerenciamento de dados, incluindo governança de dados, segurança e conformidade com regulamentações (como GDPR e LGPD);
  • Garantir a proteção dos dados sensíveis e confidenciais ao longo do ciclo de vida do ML;
  • Identificar gargalos e otimizar o desempenho dos pipelines de dados e dos modelos de ML;
  • Utilizar técnicas avançadas de otimização para melhorar a eficiência e reduzir custos operacionais;
  • Implementar novas ferramentas que possam melhorar os processos e a eficiência operacional;
  • Documentar todos os processos, procedimentos e configurações de infraestrutura relacionados aos pipelines de MLops;

Conhecimentos:

  • Conhecimento em design e arquitetura de bancos de dados;
  • Experiência em processos de extração, transformação e carga de dados;
  • Familiaridade com Hadoop, Spark, Kafka;
  • Habilidade em construir e gerenciar pipelines de ML;
  • Experiência com ferramentas de CI/CD para ML como Jenkins, GitLab CI, etc;
  • Conhecimento em deploy de modelos de ML em produção utilizando frameworks como TensorFlow Serving, Docker, Kubernetes;
  • Habilidades em monitorar e manter modelos de ML em produção;
  • Proficiência com serviços de nuvem específicos para dados e ML, como AWS SageMaker, Azure Machine Learning, Google AI Platform;
  • Experiência com S3, Redshift, e ferramentas da nuvem AWS.

Desejável:

Certificação AWS.