AI Engineer construindo sistemas multiagente, RAG e Document AI em produção. Da extração documental validada por schema à decisão auditável — sem alucinação de veredito, com observabilidade ponta a ponta e mais de 50% de redução no custo com LLMs.
Como eu transformo documentos densos em decisões confiáveis, rastreáveis até a página de origem
Eu construo sistemas de IA que leem documentos extensos, recuperam o contexto certo e decidem com auditoria — nunca um chatbot genérico. A regra de ouro: nenhum LLM define o resultado final. A extração é separada da decisão, validada por schema antes de persistir.
OCR, extração de layout e chunking ciente de página para PDFs e editais extensos. Processamento em lotes que dá conta de documentos que nenhum analista leria por inteiro.
Recuperação vetorial com embeddings e reranking sobre a base de conhecimento. Busca semântica que encontra o trecho relevante — com rastreabilidade até a página de origem.
Arquiteturas multiagente com Semantic Kernel e LangGraph: planning, memory e tool calling. Parsing determinístico combinado com extração por LLM, com saída validada por schema.
Modelo primário + fallback, concorrência controlada e avaliação contínua contra gabarito. Trilha de auditoria ponta a ponta com OpenTelemetry, do dado extraído até a decisão.
O resultado? Decisão auditável e sem alucinação de veredito, que substitui revisão manual em escala — com a separação estrita entre extração e decisão e validação antes de qualquer persistência.
Engenheiro hands-on, da automação de processos à IA generativa em produção
AI Engineer com trajetória de automação de processos desde 2019, evoluindo da modernização de sistemas legados para IA generativa em produção. Construí agentes em GPT-3.5 com tool calling manual já no início de 2023 — antes do suporte nativo de function calling.
Atuação atual em orquestração de agentes, RAG e Document AI: arquiteturas multiagente, extração documental com saída validada por schema, prompt engineering anti-alucinação e observabilidade ponta a ponta. Impacto mensurável — mais de 50% de redução no custo com LLMs via gateway de inferência.
Domínio aplicado em Govtech / legaltech (Lei 14.133/2021), COMEX / DUIMP e avaliação de redações (ENEM). Inglês para leitura técnica avançada.
Da automação de processos à engenharia de IA generativa em produção
Engenharia de IA generativa para os setores público e educacional: avaliação documental e textual em larga escala.
Arquiteto e referência técnica solo da plataforma de IA corporativa AYA Search.
Modernização de sistemas legados, integração COMEX com IA e sustentação de e-commerce B2B.
Automação de processos e apoio à decisão integrando sistemas legados, com os primeiros fluxos agênticos.
Projetos reais com impacto mensurável em produção
Pipeline multiagente em Semantic Kernel para análise de habilitação, combinando parsing determinístico e extração por LLM com saída validada por schema.
Sistema multiagente que avalia tangência ao tema, proposta de intervenção e elementos textuais, gerando feedback pedagógico para a rede estadual (Seduc-SP).
RAG end-to-end com orquestração de LLMs, ingestão de documentos (Docling), chunking, reranking e recuperação semântica integrada ao ambiente corporativo.
Roteamento entre LLMs comerciais (GPT-4) e open-weights locais (Qwen3, DeepSeek-R1) por complexidade da consulta, com deploy híbrido on-premise + cloud GPU (vLLM).
Camada de extração documental com OCR, layout e chunking ciente de página, processando documentos extensos em lotes com rastreabilidade até a página de origem.
Arquitetura event-driven: Debezium (CDC) → Kafka Connect → microsserviços agregadores em Go → modelagem RAW → FCT, alimentando a IA com dados frescos.
Geração de descrições técnicas no formato obrigatório da Receita Federal com prompts estruturados, integrada ao fluxo de importação.
Fluxo agêntico completo em GPT-3.5 com tool calling manual via parsing de intenção e roteamento por JSON estruturado — anterior ao function calling nativo da API.
Ferramentas e tecnologias que domino no dia a dia
Aberto a oportunidades como AI Engineer
Envie uma mensagem diretamente pelo WhatsApp. Respondo rapidamente!
Chamar no WhatsApp