Retrato profissional de Flávia Gaia
Python Engenharia de IA NLP MLOps LLMOps GenAI

Olá, seja bem-vindo. Eu sou a Flávia, Cientista de Dados Sênior com 6 anos de experiência em IA, dados e automação. Minha atuação combina IA generativa, NLP, machine learning e todo o processo de dados que sustenta a ciência de dados, da estruturação e qualidade da informação até a modelagem, automação e aplicação em contextos reais.

Experiência
6 anos em dados, IA e analytics
Posicionamento
Cientista de Dados Sênior
Especialidade
IA generativa, RAG e arquitetura de dados
Base acadêmica
UnB, USP e IESB

Resumo executivo

O que levo para times de dados e produto

01

IA aplicada a fluxos críticos

Tenho experiência em automação de auditoria, leitura de contratos, extração de cláusulas, conformidade normativa e recuperação de informação técnica com LLMs e sistemas multiagentes.

02

Base sólida em ciência e engenharia

Atuo com Python, Spark, Databricks, Delta Lake, MLflow, Streamlit, LangChain e pipelines orientados a governança, monitoramento e produção.

03

Comunicação e formação contínua

Além da prática profissional, mantenho produção técnica forte, certificações recentes em Data Engineering e pesquisa acadêmica em Ciência dos Dados.

Trajetória profissional

Experiência construída entre indústria 4.0, governo, consultoria e IA aplicada

Atual

FNDE / ecossistema G4F

Cargo: Cientista de Dados Sênior

Estruturação de ambiente analítico em Azure e Databricks com Arquitetura Medallion, pipelines escaláveis, governança e base para ciência de dados aplicada a auditoria e inteligência.

Antes

BBTS

Cargo: Cientista de Dados Sênior / Engenheira de IA Sênior

Desenvolvimento de sistema inteligente para calendário de pagamentos a partir de contratos em PDF, com LangChain, CrewAI, Databricks Workflows e persistência em Delta Lake.

Petrobras

Compass UOL

Cargo: Cientista de Dados Especialista em IA

Criação de soluções com LLMs para extração técnica de PDFs, RAG de normativos, validação em Streamlit, versionamento com MLflow e uso de agentes autônomos.

Base

EVCOMX · serviço para a Petrobras

Cargo: Cientista de Dados / Especialista em IA

Atuação em machine learning, NLP, extração técnica de dados, Streamlit, prompts few-shot e evolução de pipelines de regex para LLMs aplicados a problemas reais.

Governo

MDS · Ministério do Desenvolvimento Social, Família e Combate à Fome

Cargo: Analista de Dados

Análise de bases governamentais massivas, como Bolsa Família, BPC e Cadastro Único, com Big Data, SQL, scripts em Python e dashboards analíticos voltados a suporte à decisão.

Início

Presidência da República

Cargo: Estagiária de Ciência de Dados

Coleta automatizada de notícias com web scraping, uso de NLP com spaCy para NER e sumarização, visualização em Power BI e projetos experimentais com deep learning.

Áreas de atuação

Um perfil híbrido entre profundidade técnica, aplicação real e visão de negócio

IA Generativa e LLMOps

Desenvolvimento de soluções com LLMs, RAG, agentes e fluxos estruturados para extração, análise, automação e apoio à decisão em contextos corporativos.

Machine Learning e NLP

Experiência com classificação, modelos supervisionados, processamento de linguagem natural, embeddings, deep learning e aplicações voltadas a texto, documentos e dados não estruturados.

Dados, Arquitetura e Pipelines

Estruturação de ambientes analíticos, pipelines escaláveis, governança, qualidade de dados e arquitetura moderna para dar sustentação a analytics, machine learning e IA.

Analytics e Suporte à Decisão

Análise exploratória, conciliação de bases, dashboards, monitoramento e tradução de dados em leituras claras para áreas técnicas, operacionais e de negócio.

Formação e certificações

Credenciais que sustentam a parte prática do meu trabalho

Acadêmico

UnB, USP e IESB

Mestrado em Computação Aplicada na UnB, MBA em Inteligência Artificial e Big Data pela USP e bacharelado em Ciência de Dados e Inteligência Artificial pelo IESB.

Pesquisa

Ciência dos Dados e textos jurídicos

Linha de pesquisa em Ciência dos Dados, com estudo sobre reconhecimento de entidades nomeadas em textos jurídicos e base consistente em bancos de dados, mineração de dados massivos e experimentação aplicada.

2025-2026

Data Engineering e Databricks

Certificações recentes em Airflow, Spark, Snowflake, BigQuery, Modern Data Stack e trilhas Databricks ligadas à preparação de dados para machine learning e agentes de recuperação.

Certificações em destaque

Certificações

Badge Databricks

Databricks

Badge ligado a trilhas de machine learning e ecossistemas modernos de dados.

Badge Databricks

Retrieval Agents

Construção de agentes de recuperação e fluxos aplicados dentro do universo Databricks.

Badge Palantir Foundry

Palantir Foundry

Formação voltada à construção de soluções de dados e operações com plataformas corporativas.

Badge Palantir Foundry

AIP Foundations

Base complementar em aplicação de IA e workflows sobre o ecossistema Palantir.

Functions, Tools and Agents with LangChain

Especialização no uso de OpenAI Function Calling e ferramentas do LangChain para transformar LLMs em agentes operacionais.

Certificado Profissional de Análise de Dados do Google

Processo completo de análise de dados utilizando BigQuery, R, SQL e Sheets.

Introduction to LangGraph e LangSmith

Formação em orquestração de fluxos com grafos, observabilidade, rastreabilidade e avaliação de aplicações com LLMs, fortalecendo práticas de engenharia de IA.

Experiência acadêmica

Leia os meus TCCs

IESB · 2023

NER em textos jurídicos com spaCy e aplicação publicada

No TCC da graduação, desenvolvi dois modelos spaCy ajustados em português do Brasil para reconhecimento de entidades nomeadas no domínio jurídico, usando o dataset LeNER-Br e publicando um aplicativo funcional no Hugging Face.

  • Tema: extração de legislação, jurisprudência, pessoas, tempo, local e organização em textos legais.
  • Resultados: F1 de 81,42% no modelo small e 83,76% no modelo large, com desempenho acima de 80%.
  • Gancho: pesquisa aplicada com NLP jurídico, avaliação comparativa e entrega utilizável por usuário final.
USP · 2023

CNN para apoio ao diagnóstico de COVID-19 em raio X

Na monografia do MBA, desenvolvi e validei um modelo de redes neurais convolucionais para classificar imagens de raio X do tórax, com foco em apoio ao diagnóstico da COVID-19.

  • Base criada com 2.089 imagens, sendo 505 casos de COVID-19 e 1.580 casos normais.
  • Resultados: 98,40% de acurácia no teste, com ajuste de hiperparâmetros e aumento de dados.
  • Gancho: deep learning aplicado à saúde, desenho experimental e código público no GitHub.

Presença digital

Onde aprofundar meu trabalho

Contato

Entre em contato comigo e vamos conversar

Sempre estou aberta a novas oportunidades.