Pessoa Engenheiro de Dados Pleno (Remoto)
Youx GroupLavras - MG
1 posição
Não informado
Integral
Quer se tornar um Youxer ? Se liga, essa vaga é PJ e Remota!
O que você vai fazer:
Estamos em busca de um(a) Engenheiro(a) de Dados Pleno para integrar nosso time de tecnologia. Você será responsável por projetar, construir e otimizar nossos pipelines de dados, garantindo que as informações fluam de maneira eficiente e segura. Nesta posição, você terá um papel estratégico na modernização da nossa plataforma de dados, estruturando a infraestrutura necessária para suportar modelos de Machine Learning e soluções baseadas em Inteligência Artificial Generativa.
- Desenvolvimento de Pipelines: Projetar, construir, testar e manter pipelines de dados escaláveis (batch e streaming) e processos de ETL/ELT;
- Infraestrutura para IA: Desenvolver e manter pipelines de dados voltados para o ciclo de vida de Machine Learning, integrando dados estruturados e não estruturados;
- Qualidade e Governança: Garantir a qualidade, integridade e segurança dos dados, aplicando práticas de governança e curadoria de dados para uso em modelos preditivos e LLMs;
- Otimização de Performance: Monitorar o desempenho dos fluxos de dados e otimizar consultas complexas, reduzindo custos e tempo de processamento;
- Colaboração com Times de IA: Trabalhar em conjunto com Cientistas de Dados e Engenheiros de Machine Learning para entender requisitos e viabilizar o consumo de dados em larga escala.
O que a YouX espera de você:
- Experiência prévia consolidada 2 - 4 anos atuando como Engenheiro de Dados;
- Forte domínio em SQL (modelagem, otimização e processamento) e Python (foco em manipulação de dados com Pandas, PySpark, etc.);
- Experiência prática com plataformas de nuvem (AWS, GCP ou Azure) e serviços de Data Warehouse (BigQuery, Redshift ou Snowflake);
- Experiência prática na estruturação de dados não estruturados (textos, PDFs, imagens) e integração com bancos de dados vetoriais (como Pinecone, Milvus, Chroma, pgvector ou Weaviate) para suportar sistemas de busca semântica e RAG (Retrieval-Augmented Generation);
- Vivência com orquestradores de tarefas (preferencialmente Apache Airflow);
- Familiaridade com bancos de dados relacionais e NoSQL;
- Experiência com APIs e integrações de sistemas diversos;
- Familiaridade com conceitos de processamento de linguagem natural (PLN) e embeddings;
- Comunicação Assertiva: Facilidade para interagir com times de negócios e técnicos, conseguindo explicar limitações e possibilidades tecnológicas de forma clara para quem não é da área;
- Pensamento Crítico e Visão de Negócio: Foco em resolver a raiz dos problemas estruturais, sabendo priorizar tarefas que entreguem o maior valor agregado e eficiência de custos para a empresa;
- Proatividade/ Autonomia e senso de dono sobre os pipelines, antecipando falhas, propondo melhorias ativamente e documentando decisões de arquitetura;
- Espírito Colaborativo: Empatia para entender a "dor" de quem consome os dados e disposição para compartilhar conhecimento com a equipe;
- Adaptabilidade: Resiliência para lidar bem com mudanças de escopo, novas fontes de dados ou evoluções de tecnologia sem perder o foco na entrega
Diferenciais que chamam nossa atenção
- Práticas e Ferramentas de MLOps: Familiaridade com pipelines de deploy, monitoramento e versionamento de modelos de Machine Learning utilizando ferramentas como MLflow, Kubeflow, Kedro ou serviços nativos de nuvem (como AWS SageMaker ou GCP Vertex AI);
- Construção de Feature Stores: Experiência no design e manutenção de Feature Stores (ex: Feast), garantindo que dados de treino e de inferência em tempo real estejam sempre consistentes e disponíveis para os cientistas de dados;
- Curadoria e Governança de Dados para IA: Conhecimento em técnicas de higienização, rotulagem e preparação de dados em larga escala (Data Curation) especificamente para o treinamento de modelos de linguagem (LLMs) e IA tradicional;
- Otimização de Pipelines com IA: Uso de ferramentas de IA generativa e assistentes de código (como GitHub Copilot) para acelerar a escrita, otimização e documentação de pipelines e consultas SQL complexas.
Valorizamos seu bem estar na YouX!
- Cuidado para sua saúde: Plano Médico, Odontológico, Telemedicina e Seguro de Vida;
- Flash multibenefícios personalizados;
- O descanso é primordial: Descanso remunerado.
- Comemore seu dia: Day off no dia do seu aniversário!
- Nós oferecemos o Gympass para facilitar sua rotina saudável;
- Autonomia e flexibilidade;
- Ginástica laboral e Qualidade de Vida;
- Programa de capacitação e treinamentos, a Academia X;
- Inicie sua jornada de autoconhecimento: Profiler e mapeamento comportamental.
Etapas do Processo Seletivo:
- Triagem;
- Perguntas Automatizadas;
- Entrevista Comportamental (R&S e Técnico);
- Painel com o Gestor;
- Comitê de Fit Cultural;
- Proposta.
VENHA SER O X QUE FALTAVA!
Requisitos
Escolaridade
- Graduação