Experiência técnica com:

Python, R e desejável Redshift;
Experiência atuando com modelagem estatística, validação de tendências, scores, relevância, fraude, riscos, performance e resultado, manipulação de bancos de dados e otimização de algoritmos. Desenvolvimento de algoritmos de machine learning.

Requisitos e qualificações

Formação:

Graduação em Ciência da Computação, Engenharia de Software, Engenharia de Dados ou áreas correlatas. Pós-graduação ou certificações em áreas relevantes são desejáveis.

Experiência:

A partir de 7 anos de experiência profissional na área de tecnologia da informação, com pelo menos 5 anos dedicados especificamente à engenharia de dados, MLOps ou Ciência de dados.

Responsabilidades:

Projetar, desenvolver e manter pipelines de dados eficientes e escaláveis para coletar, processar e transformar dados brutos em formatos prontos para uso em modelos de aprendizado de máquina;
Garantir a qualidade, integridade e consistência dos dados ao longo de todo o ciclo de vida do ML;
Implementar pipelines de CI/CD (Integração Contínua/Entrega Contínua) para automação de testes, validação e implantação de modelos de ML;
Automatizar processos de treinamento, validação, deployment e monitoramento de modelos;
Configurar e gerenciar a infraestrutura necessária para suportar o ciclo de vida do ML, incluindo ambientes de desenvolvimento, teste e produção;
Utilizar ferramentas de gerenciamento de contêineres como Docker e Kubernetes para escalar e orquestrar modelos de ML;
Monitorar o desempenho dos modelos em produção e implementar alertas e métricas para identificar e resolver problemas;
Realizar manutenção regular dos modelos para garantir que permaneçam atualizados e eficazes;
Trabalhar em estreita colaboração com cientistas de dados, engenheiros de software e outros stakeholders para entender os requisitos do projeto e garantir a entrega eficaz de soluções de ML;
Facilitar a comunicação e a colaboração entre as equipes de desenvolvimento e operações para garantir uma integração perfeita;
Implementar práticas de gerenciamento de dados, incluindo governança de dados, segurança e conformidade com regulamentações (como GDPR e LGPD);
Garantir a proteção dos dados sensíveis e confidenciais ao longo do ciclo de vida do ML;
Identificar gargalos e otimizar o desempenho dos pipelines de dados e dos modelos de ML;
Utilizar técnicas avançadas de otimização para melhorar a eficiência e reduzir custos operacionais;
Implementar novas ferramentas que possam melhorar os processos e a eficiência operacional;
Documentar todos os processos, procedimentos e configurações de infraestrutura relacionados aos pipelines de MLops;

Conhecimentos:

Conhecimento em design e arquitetura de bancos de dados;
Experiência em processos de extração, transformação e carga de dados;
Familiaridade com Hadoop, Spark, Kafka;
Habilidade em construir e gerenciar pipelines de ML;
Experiência com ferramentas de CI/CD para ML como Jenkins, GitLab CI, etc;
Conhecimento em deploy de modelos de ML em produção utilizando frameworks como TensorFlow Serving, Docker, Kubernetes;
Habilidades em monitorar e manter modelos de ML em produção;
Proficiência com serviços de nuvem específicos para dados e ML, como AWS SageMaker, Azure Machine Learning, Google AI Platform;
Experiência com S3, Redshift, e ferramentas da nuvem AWS.

Desejável:

Certificação AWS.

Apply for job

Cookie	Duração	Descrição
cookielawinfo-checbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Vagas SPTR – Aldeia

O SPTR é o braço da Aldeia que conecta realizadores com o mercado. Aqui, você encontrará empresas e iniciativas incríveis para destravar sua carreira.

Cientista de Dados Sênior

Remoto, Home Office

Publicado 15 horas atrás

Leega

Overview

Cientista de Dados Sênior

Remoto, Home Office Publicado 15 horas atrás Leega

Overview

Related Jobs

Analista de BI Pleno

Cientista de Dados – Vaga para Mulheres

Analista BI

A Aldeia e os Cookies

Remoto, Home Office

Publicado 15 horas atrás

Leega