Detailed Portfolio

An expanded view of my technical background

This page works as a memory map for interviews: it organizes my real experience, certifications, technical repertoire and talking points so I can answer with clarity, depth and context.

LLMs RAG, agents, LangChain, CrewAI, LangGraph and MLflow
Experience 6 years in data, AI, analytics and automation
Academic Background UnB, USP, IESB and strong Data Engineering tracks

Frentes principais

Casos reais para lembrar o que fiz

FNDE

Estruturação de ecossistema de dados em Azure e Databricks

Atuação na coordenação e estruturação de ambiente analítico com Arquitetura Medallion, pipelines escaláveis, rotinas de qualidade e governança, além da consolidação de um ecossistema de ciência de dados voltado à padronização e à colaboração.

  • Desafio: sair do dado fragmentado para uma base confiável e reutilizável.
  • Stack: Azure, Databricks, Python, Jupyter, CI/CD, governança de dados.
  • Gancho de entrevista: arquitetura, fundação analítica e visão sistêmica.
BBTS

Calendário inteligente de pagamentos com contratos em PDF

Criação de sistema automatizado para extrair cláusulas financeiras de contratos, gerar calendário de pagamentos e apoiar auditoria com LLMs, LangChain, CrewAI e Databricks.

  • Desafio: transformar documento não estruturado em fluxo operacional confiável.
  • Stack: LangChain, CrewAI, Databricks Workflows, Delta Lake, LLMs.
  • Gancho de entrevista: IA aplicada a auditoria, extração e automação de decisão.
Compass UOL

RAG e agentes para conformidade normativa na Petrobras

Construção de soluções com LLMs para extração de informações técnicas em PDFs, RAG de normativos, validação humana em Streamlit e versionamento de prompts e métricas com MLflow.

  • Desafio: melhorar recuperação de contexto e confiabilidade das respostas.
  • Stack: Python, LLMs, RAG, Streamlit, MLflow, CrewAI, FAISS.
  • Gancho de entrevista: avaliação de prompts, retrieval e LLMOps.
EVCOMX

Evolução de regex para LLMs em extração técnica

Evolução de pipelines de extração a partir de regex para uma abordagem com LLMs, prompts few-shot, interface de validação e Human-in-the-Loop para melhoria contínua.

  • Desafio: sair de regras rígidas para extração mais robusta e adaptável.
  • Stack: Python, regex, LangChain, Streamlit, CrewAI, avaliação iterativa.
  • Gancho de entrevista: transição entre heurística, NLP e IA generativa.

Base da carreira

Onde construí repertório antes da senioridade atual

MDS

Análise de bases governamentais massivas

Trabalho com bases como Bolsa Família, BPC e Cadastro Único em ambiente de Big Data, com processamento distribuído, SQL, scripts em Python e dashboards analíticos.

Presidência

NLP, scraping e monitoramento automatizado

Coleta automatizada de notícias via web scraping, uso de spaCy para NER e sumarização em português, além de visualização em Power BI e aplicações de CNN para COVID-19 em raio X.

Sinais de profundidade

Temas que já estudei, publiquei ou desenvolvi

IA aplicada

RAG, agentes, LangChain, CrewAI, LangGraph, AutoGen e n8n

Seu material profissional mostra domínio consistente na construção de arquiteturas de recuperação, agentes com ferramentas, avaliação de fluxo e aplicação produtiva de LLMs.

Machine Learning

Scikit-Learn, PyTorch, TensorFlow, classificação e deep learning

Há base prática em modelagem, redes neurais, classificação, detecção de fake news, CNNs e fundamentos sólidos de avaliação.

Grafos

PyTorch Geometric, GCN, GAT, GraphSAGE e GIN

Conteúdo aprofundado sobre redes neurais de grafos, bibliotecas e caminhos de implementação dentro do ecossistema Python.

Big Data

Spark, Airflow, BigQuery, Snowflake e processamento distribuído

Seus certificados de 2025 e materiais de trabalho reforçam maturidade em engenharia de dados, orquestração e plataformas modernas de analytics.

Pesquisa e academia

NER em textos jurídicos e Ciência dos Dados na UnB

A linha de pesquisa em Ciência dos Dados e as disciplinas já cursadas na UnB adicionam profundidade conceitual em mineração de dados, bancos massivos e gestão de projetos.

Guia para entrevistas

Blocos de memória para responder com mais contexto

Como me apresentar em 60 segundos

Sou uma Cientista de Dados Sênior com 6 anos de experiência, focada em IA aplicada, LLMs, RAG e arquitetura de dados. Atuo conectando modelagem, automação, governança e engenharia para transformar problemas complexos em soluções utilizáveis.

Quando perguntarem sobre diferencial

Meu diferencial é um perfil híbrido: consigo discutir IA generativa, retrieval, agentes e prompt engineering sem perder a base de dados, o desenho de pipeline, a governança e a visão de implantação.

Quando perguntarem sobre projetos com IA

Vale puxar os casos de contratos em PDF, conformidade normativa, extração técnica e auditoria com IA, mostrando como desenhei fluxos com LLMs, RAG, agentes e validação humana.

Quando perguntarem sobre dados em escala

Posso citar a estruturação de ambientes em Azure e Databricks, uso de Arquitetura Medallion, Delta Lake, além das formações em Spark, Airflow, Snowflake e BigQuery.

Quando perguntarem sobre comunicação

Tenho histórico consistente de escrita técnica, 103 publicações, 46 artigos e experiência em traduzir decisões técnicas para times, stakeholders e contextos de negócio.

Quando perguntarem sobre aprendizado contínuo

Posso ancorar essa resposta no mestrado em andamento, no MBA já concluído, nas certificações recentes de engenharia de dados e nas trilhas de Databricks e IA generativa.

Formação validada

Credenciais e marcos acadêmicos

UnB

Mestrado em Computação Aplicada, linha de pesquisa em Ciência dos Dados, vínculo ativo desde março de 2024.

USP

MBA em Inteligência Artificial e Big Data concluído em 30 de setembro de 2023, com 420 horas e 100% de frequência.

IESB

Bacharelado em Ciência de Dados e Inteligência Artificial concluído em 15 de julho de 2023, carga horária integralizada de 3340 horas.

Pesquisa

Estudo em reconhecimento de entidades nomeadas em textos jurídicos e base curricular em bancos de dados massivos, mineração e ML.

TCCs e monografias

Experiência acadêmica que vale citar em entrevistas

Graduação

Aplicação de técnicas de reconhecimento de entidades nomeadas em textos jurídicos

TCC do IESB orientado a NLP jurídico em português do Brasil, comparando dois modelos spaCy ajustados ao domínio legal e entregando também um protótipo acessível ao usuário.

  • Problema: documentos jurídicos são extensos, complexos e difíceis de estruturar manualmente.
  • Metodologia: ajuste fino dos modelos pt_core_news_sm e pt_core_news_lg com o corpus LeNER-Br.
  • Resultados: F1-score de 81,42% no modelo small e 83,76% no modelo large; destaque para TEMPO e LEGISLAÇÃO.
  • Entrega: aplicativo web em Streamlit publicado no Hugging Face para comparação dos modelos e uso prático.
  • Como contar: mostra domínio de NLP, spaCy, avaliação de modelos e capacidade de transformar pesquisa em produto.
MBA

Aplicação de CNNs na classificação de imagens de raio X para COVID-19

Monografia da USP focada no desenvolvimento e validação de um modelo de deep learning para apoio ao diagnóstico da COVID-19 a partir de imagens de tórax.

  • Problema: acelerar e apoiar a identificação de casos em contexto de alta demanda diagnóstica.
  • Metodologia: construção de base com 2.089 imagens, aumento de dados, grid search e CNN em Python/TensorFlow.
  • Resultados: 98,40% de acurácia no conjunto de teste e 96,88% de validação com configuração otimizada.
  • Entrega: código público no GitHub e comparação com trabalhos correlatos da literatura.
  • Como contar: reforça base em deep learning, visão experimental, métricas e aplicação em saúde.

Certificações e repertório

Assuntos e trilhas que reforçam minha autoridade técnica

AWS AI Practitioner e Azure AI Fundamentals

Base formal em conceitos de IA generativa, serviços gerenciados e arquitetura de soluções.

Arquiteto de Dados 4.0

Formação de 360 horas concluída em 5 de setembro de 2025, cobrindo Modern Data Stack, Spark, Airflow e Snowflake.

Databricks

Trilhas recentes em Data Preparation for Machine Learning e Building Retrieval Agents on Databricks, concluídas em março de 2026.

Airflow, Spark, Snowflake e BigQuery

Certificações concluídas em 2025 reforçando engenharia de dados, orquestração e plataformas analíticas modernas.

LangGraph, ChatGPT e formação contínua em IA

Inclui certificação em Introduction to LangGraph, palestra acadêmica na USP e trilhas complementares de IA e ciência de dados.

Produção técnica pública

103 publicações, 46 artigos, 40 repositórios públicos e conteúdo recorrente sobre IA, dados e bibliotecas Python.

Leitura ampliada dos certificados

O que esse acervo de certificados comunica sobre meu perfil

Profundidade em engenharia de dados

Os certificados de 2025 mostram um esforço estruturado em plataforma de dados, pipelines, cloud analytics e arquitetura moderna, indo além de conhecimento superficial de ferramenta.

Atualização prática em ecossistemas modernos

As trilhas de Databricks e LangGraph reforçam acompanhamento contínuo do que está mais relevante hoje em machine learning, retrieval e construção de agentes.

Base ampla construída ao longo do tempo

Os certificados complementares indicam formação progressiva em Python, NLP, Power BI, probabilidade, RStudio, Pentaho e Data Science, consolidando uma base versátil.

Governança e responsabilidade

O conjunto Petrobras adiciona sinais importantes de atuação em contexto corporativo regulado, com foco em LGPD, segurança da informação, ética, direitos humanos e prevenção a riscos.

Encerramento

Este portfólio pode evoluir para uma versão ainda mais personalizada

A estrutura já está pronta para substituir o Linktree. O próximo passo mais valioso é inserir casos reais da sua trajetória com nome da empresa, objetivo, stack, impacto e aprendizados.