Blog

Artigos sobre IA, LLMs, RAG e desenvolvimento de sistemas inteligentes em produção. Experiências reais e lições aprendidas.

O gap entre ter dados e entender o que está nos dados
dadosferramentasinspeção

O gap entre ter dados e entender o que está nos dados

Antes de qualquer pipeline de AI processar dados, alguém precisa inspecioná-los. Excel quebra com volumes reais. Python resolve o volume mas exige código para cada pergunta. Existe uma camada de ferramentas que fica no meio e que faz essa inspeção ser prática.

4 min de leitura
Ler artigo
Multi-tenancy em agentes: onde a separação de dados tem que ser feita
multi-tenancyLangGraphauth

Multi-tenancy em agentes: onde a separação de dados tem que ser feita

O default de qualquer deploy de agente é perigoso: qualquer usuário pode ver os dados de qualquer outro. Resolver isso exige uma decisão arquitetural sobre onde a separação de contexto é feita. Na borda, na aplicação, ou na camada de infraestrutura de agente.

4 min de leitura
Ler artigo
O problema de latência em voice AI e o que full-duplex muda
vozvoice AIlatência

O problema de latência em voice AI e o que full-duplex muda

Todo sistema de voz que você já usou tem o mesmo problema: três modelos em cadeia gerando três atrasos que se acumulam. O PersonaPlex resolveu isso com uma arquitetura diferente. Mas resolveu uma coisa e introduziu outra.

4 min de leitura
Ler artigo
Quando o seu agente usa outro agente para codar
Claude Codesubagentesorquestração

Quando o seu agente usa outro agente para codar

Claude Code pode ser invocado como subagente por um orquestrador maior. Isso muda o que é possível construir: em vez de um agente especializado que gera código, você tem um agente geral que delega tarefas de código para um subagente com capacidade de execução.

4 min de leitura
Ler artigo
A harness é o produto, não o modelo
harnessagenteswhatsapp

A harness é o produto, não o modelo

Chamar uma API de LLM não é construir um agente. A harness, o conjunto de responsabilidades ao redor do modelo, é o que transforma uma resposta em texto num sistema confiável. Entender isso muda o que você produz.

5 min de leitura
Ler artigo
Quando o modelo não degradou, mas o agente piorou
harnessestabilidadecontexto

Quando o modelo não degradou, mas o agente piorou

Existe uma categoria de reclamações sobre 'degradação de modelo' que, olhando com cuidado, não é degradação de modelo nenhuma. É degradação de harness. A diferença importa para quem está construindo sistemas que precisam ser estáveis.

5 min de leitura
Ler artigo
Guardrail não é uma camada única
guardrailssegurançaagentes

Guardrail não é uma camada única

O mercado trata guardrail como um único portão de segurança. Na prática, sistemas reais precisam de múltiplas camadas com responsabilidades distintas, e saber onde colocar cada uma faz a diferença entre um sistema resiliente e um demo bonito.

5 min de leitura
Ler artigo
GraphRAG: quando RAG vetorial começa a falhar
RAGGraphRAGgrafos

GraphRAG: quando RAG vetorial começa a falhar

RAG vetorial funciona bem para buscas diretas em documentos isolados. Mas quando a resposta exige conectar informação espalhada por centenas de fontes, a abordagem tradicional falha de forma silenciosa. GraphRAG existe para resolver esse problema específico.

4 min de leitura
Ler artigo
O problema que o DeepSeek Vision resolve que ninguém estava falando
DeepSeekmultimodalvisão

O problema que o DeepSeek Vision resolve que ninguém estava falando

Modelos multimodais evoluíram muito em resolução e detalhamento. Mas havia um gap diferente e mais fundamental: a linguagem é imprecisa para apontar objetos num raciocínio visual longo. O DeepSeek Vision resolveu isso de uma forma inesperadamente elegante.

4 min de leitura
Ler artigo
Como você gasta a janela de contexto determina o que o modelo consegue fazer
LLMscontextojanela de contexto

Como você gasta a janela de contexto determina o que o modelo consegue fazer

A janela de contexto não é um espaço de armazenamento. É a memória de trabalho do modelo. O que você coloca ali, em que formato, em que ordem, determina a qualidade do raciocínio que sai. Saber gerir esse recurso é a habilidade mais subestimada em quem trabalha com LLMs.

4 min de leitura
Ler artigo
O ponto de entrada define se o sistema vai ser usado
automaçãocapturaN8N

O ponto de entrada define se o sistema vai ser usado

A maioria dos sistemas de captura morre no ponto de entrada, não no processamento. A diferença entre um alarme de incêndio e um fichário é o que separa uma automação que funciona de uma que você abandona na primeira semana.

4 min de leitura
Ler artigo
Os três pilares para um agente que melhora com o uso
agentesmemóriaskills

Os três pilares para um agente que melhora com o uso

A maioria dos agentes de IA sabe o que sabe no lançamento e permanece assim. Construir um agente que realmente melhora com o uso exige três camadas distintas: memória de fatos, skills de domínio, e histórico consultável. Cada uma tem uma função diferente e não é substituível pelas outras.

5 min de leitura
Ler artigo