Aberto a novas oportunidades em IA

Lucas de Souza Santos

> |

AI Engineer construindo sistemas multiagente, RAG e Document AI em produção. Da extração documental validada por schema à decisão auditável — sem alucinação de veredito, com observabilidade ponta a ponta e mais de 50% de redução no custo com LLMs.

Lucas de Souza Santos Lucas de Souza Santos

Da página ao veredito auditável

Como eu transformo documentos densos em decisões confiáveis, rastreáveis até a página de origem

Eu construo sistemas de IA que leem documentos extensos, recuperam o contexto certo e decidem com auditoria — nunca um chatbot genérico. A regra de ouro: nenhum LLM define o resultado final. A extração é separada da decisão, validada por schema antes de persistir.

01

Leio o Documento

OCR, extração de layout e chunking ciente de página para PDFs e editais extensos. Processamento em lotes que dá conta de documentos que nenhum analista leria por inteiro.

Document AI Content Understanding Docling
02

Recupero o Contexto

Recuperação vetorial com embeddings e reranking sobre a base de conhecimento. Busca semântica que encontra o trecho relevante — com rastreabilidade até a página de origem.

RAG PGVector OpenSearch
03

Orquestro os Agentes

Arquiteturas multiagente com Semantic Kernel e LangGraph: planning, memory e tool calling. Parsing determinístico combinado com extração por LLM, com saída validada por schema.

Semantic Kernel LangGraph Pydantic
04

Garanto Confiabilidade

Modelo primário + fallback, concorrência controlada e avaliação contínua contra gabarito. Trilha de auditoria ponta a ponta com OpenTelemetry, do dado extraído até a decisão.

Evals OpenTelemetry Fallback

O resultado? Decisão auditável e sem alucinação de veredito, que substitui revisão manual em escala — com a separação estrita entre extração e decisão e validação antes de qualquer persistência.

Quem sou eu

Engenheiro hands-on, da automação de processos à IA generativa em produção

AI Engineer com trajetória de automação de processos desde 2019, evoluindo da modernização de sistemas legados para IA generativa em produção. Construí agentes em GPT-3.5 com tool calling manual já no início de 2023 — antes do suporte nativo de function calling.

Atuação atual em orquestração de agentes, RAG e Document AI: arquiteturas multiagente, extração documental com saída validada por schema, prompt engineering anti-alucinação e observabilidade ponta a ponta. Impacto mensurável — mais de 50% de redução no custo com LLMs via gateway de inferência.

Domínio aplicado em Govtech / legaltech (Lei 14.133/2021), COMEX / DUIMP e avaliação de redações (ENEM). Inglês para leitura técnica avançada.

Curitiba, PR — Brasil Disponível para remoto
AI Engineer — Atual Prover · IA generativa para a BigBrain
Co-fundador Nexa Inteligência Comercial

// core stack

Semantic Kernel
Python
RAG
Document AI
LLMs
Pydantic
Azure AI
OpenTelemetry

Trajetória Profissional

Da automação de processos à engenharia de IA generativa em produção

Abr 2026 — Atual
Atual

AI Engineer

Prover · IA generativa para a BigBrain

Engenharia de IA generativa para os setores público e educacional: avaliação documental e textual em larga escala.

  • Pipeline multiagente (Semantic Kernel) para análise de habilitação em licitações (Lei 14.133/2021), combinando parsing determinístico e extração por LLM com saída validada por schema.
  • Sistema de avaliação de redações (modelo ENEM) para o Redação Paulista (Seduc-SP), com feedback pedagógico em produção na rede estadual.
  • Camada de Document AI com chunking ciente de página e decisão auditável: separação estrita entre extração e decisão, com trilha de auditoria ponta a ponta.
Semantic KernelAzure AIDocument AI PydanticOpenTelemetryPython
Abr 2025 — Abr 2026

AI Engineer

CCM do Brasil

Arquiteto e referência técnica solo da plataforma de IA corporativa AYA Search.

  • Plataforma GenAI (AYA Search): RAG end-to-end com orquestração de LLMs, ingestão (Docling), chunking, reranking e prompt engineering avançado.
  • Gateway de inferência agnóstico roteando entre GPT-4 e modelos locais (Qwen3, DeepSeek-R1) por complexidade — redução de +50% no custo com APIs comerciais.
  • Plataforma de dados em tempo real: arquitetura event-driven com Debezium (CDC), Kafka Connect e microsserviços em Go (RAW → FCT).
RAGLangChainvLLM GoKafkaPGVectorOpenSearch
Mai 2023 — Mar 2025

Analista de Sustentação e Desenvolvedor, TI

OVD Importadora

Modernização de sistemas legados, integração COMEX com IA e sustentação de e-commerce B2B.

  • Integração COMEX com LLMs para descrições técnicas em conformidade DUIMP — 100% de conformidade (Receita Federal).
  • Reconciliação de preços entre legado COBOL e produção em Elasticsearch (B2B), com detecção de divergências encaminhadas à correção de causa raiz.
  • Modernização COBOL → Elasticsearch + Python e pipelines ETL multi-fonte.
PythonElasticsearchOpenAI ETLKafkaDocker
Abr 2019 — Abr 2023

Analista de Dados e Desenvolvedor, Eng. de Produto

OVD Importadora

Automação de processos e apoio à decisão integrando sistemas legados, com os primeiros fluxos agênticos.

  • Agente autônomo de e-mail (abr/2023): fluxo agêntico completo em GPT-3.5 com tool calling manual via parsing de intenção e roteamento por JSON — anterior ao function calling nativo da API.
  • Suíte de automação para engenharia de produto (certificados, orçamentos, pós-venda) e classificador fiscal de NCM integrado ao SISCOMEX.
  • Pipeline de análise integrando COBOL + Oracle EBS — reduções de 80% a 90% no trabalho manual.
GPT-3.5PythonTool Calling Oracle EBSCOBOLRPA
Pós-graduação em Arquitetura de Software Universidade Tuiuti do Paraná · 2026
Bacharelado em Engenharia Elétrica Universidade Tuiuti do Paraná · 2024

Principais Entregas

Projetos reais com impacto mensurável em produção

Multiagente Produção

Habilitação em Licitações (Lei 14.133)

Pipeline multiagente em Semantic Kernel para análise de habilitação, combinando parsing determinístico e extração por LLM com saída validada por schema.

Substitui revisão manual de meio período de um analista por edital
Semantic KernelPydanticDocument AIPython
IA Produção

Avaliação de Redações — Redação Paulista (ENEM)

Sistema multiagente que avalia tangência ao tema, proposta de intervenção e elementos textuais, gerando feedback pedagógico para a rede estadual (Seduc-SP).

Em produção em larga escala na rede estadual de SP
MultiagenteLLMsEvalsPython
RAG Produção

AYA Search — Plataforma GenAI Corporativa

RAG end-to-end com orquestração de LLMs, ingestão de documentos (Docling), chunking, reranking e recuperação semântica integrada ao ambiente corporativo.

Adotada por 10–50 usuários ativos, com evals sobre uso real
RAGOpenSearchPGVectorLangChain
Inferência Produção

Gateway de Inferência Agnóstico

Roteamento entre LLMs comerciais (GPT-4) e open-weights locais (Qwen3, DeepSeek-R1) por complexidade da consulta, com deploy híbrido on-premise + cloud GPU (vLLM).

Mais de 50% de redução no custo com APIs de LLM
GPT-4Qwen3DeepSeek-R1vLLM
Document AI

Document AI em Lotes

Camada de extração documental com OCR, layout e chunking ciente de página, processando documentos extensos em lotes com rastreabilidade até a página de origem.

Dá conta de editais e documentos longos em escala
Azure AI Content UnderstandingDoclingpypdf
Data Pipeline Produção

Plataforma de Dados em Tempo Real (CDC)

Arquitetura event-driven: Debezium (CDC) → Kafka Connect → microsserviços agregadores em Go → modelagem RAW → FCT, alimentando a IA com dados frescos.

Dados em tempo real com alta consistência
KafkaDebeziumGoSQL Server
IA COMEX

Integração DUIMP para COMEX

Geração de descrições técnicas no formato obrigatório da Receita Federal com prompts estruturados, integrada ao fluxo de importação.

100% de conformidade com o formato DUIMP
OpenAIPythonCOMEX
Agente 2023

Agente Autônomo de E-mail

Fluxo agêntico completo em GPT-3.5 com tool calling manual via parsing de intenção e roteamento por JSON estruturado — anterior ao function calling nativo da API.

Opera 100% sem intervenção humana
GPT-3.5Tool CallingPython

Stack Tecnológica

Ferramentas e tecnologias que domino no dia a dia

Multiagente & LLMs

Semantic Kernel / LangGraph Orquestração & tool calling
LangChain Pipelines de LLM
GPT-4/5 · Gemini Modelos comerciais
Qwen3 · DeepSeek-R1 Open-weights · Ollama / vLLM
Pydantic Saída estruturada validada
Prompt Engineering Anti-alucinação

RAG, Document AI & Evals

RAG Recuperação & reranking
PGVector / OpenSearch Busca vetorial
Azure AI Search Recuperação gerenciada
Content Understanding · Docling Document AI · OCR
pypdf · python-docx Chunking ciente de página
Azure AI Evaluation / Foundry Evals contra gabarito

Backend, Dados & Observabilidade

Python FastAPI, asyncio, pytest
C# / .NET · Go ASP.NET Core · microsserviços
Kafka · Debezium CDC & event-driven
PostgreSQL · SQL Server Modelagem & tuning
Azure · AWS Identity, Blob, Cosmos, EC2, S3
OpenTelemetry Telemetria ponta a ponta
Docker · CI/CD · Terraform GitHub Actions, Azure DevOps

// metodologias & práticas

ScrumKanbanCode Review TDDClean ArchitectureEvent-Driven ObservabilidadeSaída validada por schema

Vamos Conversar

Aberto a oportunidades como AI Engineer

Localização

Curitiba, PR — Brasil

Vamos conversar?

Envie uma mensagem diretamente pelo WhatsApp. Respondo rapidamente!

Chamar no WhatsApp
Co-fundador

Visite também a Nexa Inteligência Comercial

Soluções de Inteligência Artificial para empresas. Automação, chatbots, integração de dados e consultoria em IA.

Conhecer a Nexa