Lucas Santos — AI Engineer | Sistemas Multiagente · RAG

Da página ao veredito auditável

Como eu transformo documentos densos em decisões confiáveis, rastreáveis até a página de origem

Eu construo sistemas de IA que leem documentos extensos, recuperam o contexto certo e decidem com auditoria — nunca um chatbot genérico. A regra de ouro: nenhum LLM define o resultado final. A extração é separada da decisão, validada por schema antes de persistir.

Leio o Documento

OCR, extração de layout e chunking ciente de página para PDFs e editais extensos. Processamento em lotes que dá conta de documentos que nenhum analista leria por inteiro.

Document AI Content Understanding Docling

Recupero o Contexto

Recuperação vetorial com embeddings e reranking sobre a base de conhecimento. Busca semântica que encontra o trecho relevante — com rastreabilidade até a página de origem.

RAG PGVector OpenSearch

Orquestro os Agentes

Arquiteturas multiagente com Semantic Kernel e LangGraph: planning, memory e tool calling. Parsing determinístico combinado com extração por LLM, com saída validada por schema.

Semantic Kernel LangGraph Pydantic

Garanto Confiabilidade

Modelo primário + fallback, concorrência controlada e avaliação contínua contra gabarito. Trilha de auditoria ponta a ponta com OpenTelemetry, do dado extraído até a decisão.

Evals OpenTelemetry Fallback

O resultado? Decisão auditável e sem alucinação de veredito, que substitui revisão manual em escala — com a separação estrita entre extração e decisão e validação antes de qualquer persistência.

</especialidades>

<sobre>

Quem sou eu

Engenheiro hands-on, da automação de processos à IA generativa em produção

AI Engineer com trajetória de automação de processos desde 2019, evoluindo da modernização de sistemas legados para IA generativa em produção. Construí agentes em GPT-3.5 com tool calling manual já no início de 2023 — antes do suporte nativo de function calling.

Atuação atual em orquestração de agentes, RAG e Document AI: arquiteturas multiagente, extração documental com saída validada por schema, prompt engineering anti-alucinação e observabilidade ponta a ponta. Impacto mensurável — mais de 50% de redução no custo com LLMs via gateway de inferência.

Domínio aplicado em Govtech / legaltech (Lei 14.133/2021), COMEX / DUIMP e avaliação de redações (ENEM). Inglês para leitura técnica avançada.

                                Curitiba, PR — Brasil
                                Disponível para remoto
                            

                                AI Engineer — Atual
                                Prover · IA generativa para a BigBrain
                            

Co-fundador Nexa Inteligência Comercial

// core stack

Semantic Kernel

Python

RAG

Document AI

LLMs

Pydantic

Azure AI

OpenTelemetry

</sobre>

<experiência>

Trajetória Profissional

Da automação de processos à engenharia de IA generativa em produção

Abr 2026 — Atual

Atual

AI Engineer

Prover · IA generativa para a BigBrain

Engenharia de IA generativa para os setores público e educacional: avaliação documental e textual em larga escala.

Pipeline multiagente (Semantic Kernel) para análise de habilitação em licitações (Lei 14.133/2021), combinando parsing determinístico e extração por LLM com saída validada por schema.
Sistema de avaliação de redações (modelo ENEM) para o Redação Paulista (Seduc-SP), com feedback pedagógico em produção na rede estadual.
Camada de Document AI com chunking ciente de página e decisão auditável: separação estrita entre extração e decisão, com trilha de auditoria ponta a ponta.

Semantic KernelAzure AIDocument AI PydanticOpenTelemetryPython

Abr 2025 — Abr 2026

AI Engineer

CCM do Brasil

Arquiteto e referência técnica solo da plataforma de IA corporativa AYA Search.

Plataforma GenAI (AYA Search): RAG end-to-end com orquestração de LLMs, ingestão (Docling), chunking, reranking e prompt engineering avançado.
Gateway de inferência agnóstico roteando entre GPT-4 e modelos locais (Qwen3, DeepSeek-R1) por complexidade — redução de +50% no custo com APIs comerciais.
Plataforma de dados em tempo real: arquitetura event-driven com Debezium (CDC), Kafka Connect e microsserviços em Go (RAW → FCT).

RAGLangChainvLLM GoKafkaPGVectorOpenSearch

Mai 2023 — Mar 2025

Analista de Sustentação e Desenvolvedor, TI

OVD Importadora

Modernização de sistemas legados, integração COMEX com IA e sustentação de e-commerce B2B.

Integração COMEX com LLMs para descrições técnicas em conformidade DUIMP — 100% de conformidade (Receita Federal).
Reconciliação de preços entre legado COBOL e produção em Elasticsearch (B2B), com detecção de divergências encaminhadas à correção de causa raiz.
Modernização COBOL → Elasticsearch + Python e pipelines ETL multi-fonte.

PythonElasticsearchOpenAI ETLKafkaDocker

Abr 2019 — Abr 2023

Analista de Dados e Desenvolvedor, Eng. de Produto

OVD Importadora

Automação de processos e apoio à decisão integrando sistemas legados, com os primeiros fluxos agênticos.

Agente autônomo de e-mail (abr/2023): fluxo agêntico completo em GPT-3.5 com tool calling manual via parsing de intenção e roteamento por JSON — anterior ao function calling nativo da API.
Suíte de automação para engenharia de produto (certificados, orçamentos, pós-venda) e classificador fiscal de NCM integrado ao SISCOMEX.
Pipeline de análise integrando COBOL + Oracle EBS — reduções de 80% a 90% no trabalho manual.

GPT-3.5PythonTool Calling Oracle EBSCOBOLRPA

Pós-graduação em Arquitetura de Software Universidade Tuiuti do Paraná · 2026

Bacharelado em Engenharia Elétrica Universidade Tuiuti do Paraná · 2024

</experiência>

Principais Entregas

Projetos reais com impacto mensurável em produção

Multiagente Produção

Habilitação em Licitações (Lei 14.133)

Pipeline multiagente em Semantic Kernel para análise de habilitação, combinando parsing determinístico e extração por LLM com saída validada por schema.

Substitui revisão manual de meio período de um analista por edital

Semantic KernelPydanticDocument AIPython

IA Produção

Avaliação de Redações — Redação Paulista (ENEM)

Sistema multiagente que avalia tangência ao tema, proposta de intervenção e elementos textuais, gerando feedback pedagógico para a rede estadual (Seduc-SP).

Em produção em larga escala na rede estadual de SP

MultiagenteLLMsEvalsPython

RAG Produção

AYA Search — Plataforma GenAI Corporativa

RAG end-to-end com orquestração de LLMs, ingestão de documentos (Docling), chunking, reranking e recuperação semântica integrada ao ambiente corporativo.

Adotada por 10–50 usuários ativos, com evals sobre uso real

RAGOpenSearchPGVectorLangChain

Inferência Produção

Gateway de Inferência Agnóstico

Roteamento entre LLMs comerciais (GPT-4) e open-weights locais (Qwen3, DeepSeek-R1) por complexidade da consulta, com deploy híbrido on-premise + cloud GPU (vLLM).

Mais de 50% de redução no custo com APIs de LLM

GPT-4Qwen3DeepSeek-R1vLLM

Document AI

Document AI em Lotes

Camada de extração documental com OCR, layout e chunking ciente de página, processando documentos extensos em lotes com rastreabilidade até a página de origem.

Dá conta de editais e documentos longos em escala

Azure AI Content UnderstandingDoclingpypdf

Data Pipeline Produção

Plataforma de Dados em Tempo Real (CDC)

Arquitetura event-driven: Debezium (CDC) → Kafka Connect → microsserviços agregadores em Go → modelagem RAW → FCT, alimentando a IA com dados frescos.

Dados em tempo real com alta consistência

KafkaDebeziumGoSQL Server

IA COMEX

Integração DUIMP para COMEX

Geração de descrições técnicas no formato obrigatório da Receita Federal com prompts estruturados, integrada ao fluxo de importação.

100% de conformidade com o formato DUIMP

OpenAIPythonCOMEX

Agente 2023

Agente Autônomo de E-mail

Fluxo agêntico completo em GPT-3.5 com tool calling manual via parsing de intenção e roteamento por JSON estruturado — anterior ao function calling nativo da API.

Opera 100% sem intervenção humana

GPT-3.5Tool CallingPython

</projetos>

<stack>

Stack Tecnológica

Ferramentas e tecnologias que domino no dia a dia

Multiagente & LLMs

Semantic Kernel / LangGraph Orquestração & tool calling

LangChain Pipelines de LLM

GPT-4/5 · Gemini Modelos comerciais

Qwen3 · DeepSeek-R1 Open-weights · Ollama / vLLM

Pydantic Saída estruturada validada

Prompt Engineering Anti-alucinação

RAG, Document AI & Evals

RAG Recuperação & reranking

PGVector / OpenSearch Busca vetorial

Azure AI Search Recuperação gerenciada

Content Understanding · Docling Document AI · OCR

pypdf · python-docx Chunking ciente de página

Azure AI Evaluation / Foundry Evals contra gabarito

Backend, Dados & Observabilidade

Python FastAPI, asyncio, pytest

C# / .NET · Go ASP.NET Core · microsserviços

Kafka · Debezium CDC & event-driven

PostgreSQL · SQL Server Modelagem & tuning

Azure · AWS Identity, Blob, Cosmos, EC2, S3

OpenTelemetry Telemetria ponta a ponta

Docker · CI/CD · Terraform GitHub Actions, Azure DevOps

// metodologias & práticas

ScrumKanbanCode Review TDDClean ArchitectureEvent-Driven ObservabilidadeSaída validada por schema

</stack>

Lucas de Souza Santos

Da página ao veredito auditável

Leio o Documento

Recupero o Contexto

Orquestro os Agentes

Garanto Confiabilidade

Quem sou eu

// core stack

Trajetória Profissional

AI Engineer

Prover · IA generativa para a BigBrain

AI Engineer

CCM do Brasil

Analista de Sustentação e Desenvolvedor, TI

OVD Importadora

Analista de Dados e Desenvolvedor, Eng. de Produto

OVD Importadora

Principais Entregas

Habilitação em Licitações (Lei 14.133)

Avaliação de Redações — Redação Paulista (ENEM)

AYA Search — Plataforma GenAI Corporativa

Gateway de Inferência Agnóstico

Document AI em Lotes

Plataforma de Dados em Tempo Real (CDC)

Integração DUIMP para COMEX

Agente Autônomo de E-mail

Stack Tecnológica

Multiagente & LLMs

RAG, Document AI & Evals

Backend, Dados & Observabilidade

// metodologias & práticas

Vamos Conversar

Email

Telefone

Localização

Vamos conversar?

Visite também a Nexa Inteligência Comercial