Pessoa Engenheiro de Dados Pleno (Remoto)

Youx Group

Lavras - MG

1 posição

Não informado

Integral

PJ
Remoto
Pleno
Tecnologia
Comercial

Quer se tornar um Youxer ? Se liga, essa vaga é PJ e Remota!

O que você vai fazer:

Estamos em busca de um(a) Engenheiro(a) de Dados Pleno para integrar nosso time de tecnologia. Você será responsável por projetar, construir e otimizar nossos pipelines de dados, garantindo que as informações fluam de maneira eficiente e segura. Nesta posição, você terá um papel estratégico na modernização da nossa plataforma de dados, estruturando a infraestrutura necessária para suportar modelos de Machine Learning e soluções baseadas em Inteligência Artificial Generativa.

  • Desenvolvimento de Pipelines: Projetar, construir, testar e manter pipelines de dados escaláveis (batch e streaming) e processos de ETL/ELT;
  • Infraestrutura para IA: Desenvolver e manter pipelines de dados voltados para o ciclo de vida de Machine Learning, integrando dados estruturados e não estruturados;
  • Qualidade e Governança: Garantir a qualidade, integridade e segurança dos dados, aplicando práticas de governança e curadoria de dados para uso em modelos preditivos e LLMs;
  • Otimização de Performance: Monitorar o desempenho dos fluxos de dados e otimizar consultas complexas, reduzindo custos e tempo de processamento;
  • Colaboração com Times de IA: Trabalhar em conjunto com Cientistas de Dados e Engenheiros de Machine Learning para entender requisitos e viabilizar o consumo de dados em larga escala.

O que a YouX espera de você:

  • Experiência prévia consolidada 2 - 4 anos atuando como Engenheiro de Dados;
  • Forte domínio em SQL (modelagem, otimização e processamento) e Python (foco em manipulação de dados com Pandas, PySpark, etc.);
  • Experiência prática com plataformas de nuvem (AWS, GCP ou Azure) e serviços de Data Warehouse (BigQuery, Redshift ou Snowflake);
  • Experiência prática na estruturação de dados não estruturados (textos, PDFs, imagens) e integração com bancos de dados vetoriais (como Pinecone, Milvus, Chroma, pgvector ou Weaviate) para suportar sistemas de busca semântica e RAG (Retrieval-Augmented Generation);
  • Vivência com orquestradores de tarefas (preferencialmente Apache Airflow);
  • Familiaridade com bancos de dados relacionais e NoSQL;
  • Experiência com APIs e integrações de sistemas diversos;
  • Familiaridade com conceitos de processamento de linguagem natural (PLN) e embeddings;
  • Comunicação Assertiva: Facilidade para interagir com times de negócios e técnicos, conseguindo explicar limitações e possibilidades tecnológicas de forma clara para quem não é da área;
  • Pensamento Crítico e Visão de Negócio: Foco em resolver a raiz dos problemas estruturais, sabendo priorizar tarefas que entreguem o maior valor agregado e eficiência de custos para a empresa;
  • Proatividade/ Autonomia e senso de dono sobre os pipelines, antecipando falhas, propondo melhorias ativamente e documentando decisões de arquitetura;
  • Espírito Colaborativo: Empatia para entender a "dor" de quem consome os dados e disposição para compartilhar conhecimento com a equipe;
  • Adaptabilidade: Resiliência para lidar bem com mudanças de escopo, novas fontes de dados ou evoluções de tecnologia sem perder o foco na entrega

Diferenciais que chamam nossa atenção

  • Práticas e Ferramentas de MLOps: Familiaridade com pipelines de deploy, monitoramento e versionamento de modelos de Machine Learning utilizando ferramentas como MLflow, Kubeflow, Kedro ou serviços nativos de nuvem (como AWS SageMaker ou GCP Vertex AI);
  • Construção de Feature Stores: Experiência no design e manutenção de Feature Stores (ex: Feast), garantindo que dados de treino e de inferência em tempo real estejam sempre consistentes e disponíveis para os cientistas de dados;
  • Curadoria e Governança de Dados para IA: Conhecimento em técnicas de higienização, rotulagem e preparação de dados em larga escala (Data Curation) especificamente para o treinamento de modelos de linguagem (LLMs) e IA tradicional;
  • Otimização de Pipelines com IA: Uso de ferramentas de IA generativa e assistentes de código (como GitHub Copilot) para acelerar a escrita, otimização e documentação de pipelines e consultas SQL complexas.

Valorizamos seu bem estar na YouX!

  • Cuidado para sua saúde: Plano Médico, Odontológico, Telemedicina e Seguro de Vida;
  • Flash multibenefícios personalizados;
  • O descanso é primordial: Descanso remunerado.
  • Comemore seu dia: Day off no dia do seu aniversário!
  • Nós oferecemos o Gympass para facilitar sua rotina saudável;
  • Autonomia e flexibilidade; 
  • Ginástica laboral e Qualidade de Vida;
  • Programa de capacitação e treinamentos, a Academia X;
  • Inicie sua jornada de autoconhecimento: Profiler e mapeamento comportamental.  

Etapas do Processo Seletivo: 

  1. Triagem;
  2. Perguntas Automatizadas;
  3. Entrevista Comportamental (R&S e Técnico);
  4. Painel com o Gestor;
  5. Comitê de Fit Cultural;
  6. Proposta. 

VENHA SER O X QUE FALTAVA! 

Requisitos

Escolaridade

  • Graduação

Localização

Praça Tenente Francisco Souza Lima, Centro, Lavras - MG, Brasil, 37200-022