FNDE
Estruturação de ecossistema de dados em Azure e Databricks
Atuação na coordenação e estruturação de ambiente analítico com
Arquitetura Medallion, pipelines escaláveis, rotinas de
qualidade e governança, além da consolidação de um ecossistema
de ciência de dados voltado à padronização e à colaboração.
- Desafio: sair do dado fragmentado para uma base confiável e reutilizável.
- Stack: Azure, Databricks, Python, Jupyter, CI/CD, governança de dados.
- Gancho de entrevista: arquitetura, fundação analítica e visão sistêmica.
BBTS
Calendário inteligente de pagamentos com contratos em PDF
Criação de sistema automatizado para extrair cláusulas
financeiras de contratos, gerar calendário de pagamentos e
apoiar auditoria com LLMs, LangChain, CrewAI e Databricks.
- Desafio: transformar documento não estruturado em fluxo operacional confiável.
- Stack: LangChain, CrewAI, Databricks Workflows, Delta Lake, LLMs.
- Gancho de entrevista: IA aplicada a auditoria, extração e automação de decisão.
Compass UOL
RAG e agentes para conformidade normativa na Petrobras
Construção de soluções com LLMs para extração de informações
técnicas em PDFs, RAG de normativos, validação humana em
Streamlit e versionamento de prompts e métricas com MLflow.
- Desafio: melhorar recuperação de contexto e confiabilidade das respostas.
- Stack: Python, LLMs, RAG, Streamlit, MLflow, CrewAI, FAISS.
- Gancho de entrevista: avaliação de prompts, retrieval e LLMOps.
EVCOMX
Evolução de regex para LLMs em extração técnica
Evolução de pipelines de extração a partir de regex para uma
abordagem com LLMs, prompts few-shot, interface de validação e
Human-in-the-Loop para melhoria contínua.
- Desafio: sair de regras rígidas para extração mais robusta e adaptável.
- Stack: Python, regex, LangChain, Streamlit, CrewAI, avaliação iterativa.
- Gancho de entrevista: transição entre heurística, NLP e IA generativa.
Projeto próprio
Search Performance Assistant para avaliação de retrieval
Desenvolvimento de uma aplicação em Python para demonstrar busca
semântica com TF-IDF, indexação vetorial, fallback sem FAISS e
avaliação de qualidade com múltiplas estratégias de Recall@K.
- Problema: mostrar de forma prática como medir recuperação de documentos e explicar trade-offs de um pipeline de busca.
- Arquitetura: separação entre ingestão, vetorização, indexação, retrieval, camada de assistant, interface desktop e testes automatizados.
- Stack: Python, scikit-learn, TF-IDF, FAISS, similaridade de cosseno, Tkinter e unittest.
- Diferencial técnico: fallback para busca por similaridade quando FAISS não está disponível, mantendo a demo executável em ambiente local simples.
- Métrica: avaliação com Semantic Recall@K, ID Recall@K e Hybrid Recall@K para comparar recuperação por conteúdo e por identificador esperado.
- Gancho de entrevista: arquitetura de busca, vetorização, avaliação de retrieval, tratamento de dependência opcional e desenho de solução explicável.