top of page
bg_treinamento_Prancheta 1.png

Arquitetura de Sistemas AgĂȘnticos

  • 19 de jan.
  • 5 min de leitura

A arquitetura de sistemas agĂȘnticos representa uma das ĂĄreas mais dinĂąmicas e em rĂĄpida evolução no campo da inteligĂȘncia artificial. Por ser algo relativamente novo, essa arquitetura sofre modificaçÔes, melhorias e ajustes constantemente. O que estamos apresentando aqui Ă© um panorama atual dessa arquitetura, mas vale lembrar que novos desenvolvimentos podem surgir a qualquer momento.


Os Pilares Fundamentais da Arquitetura AgĂȘntica


Uma arquitetura de sistema agĂȘntico moderna Ă© composta por nove componentes principais que trabalham em conjunto para criar sistemas inteligentes e autĂŽnomos:

  • Agent

  • LLM

  • MCP

  • Memoria

  • SubAgents

  • Orquestração

  • HITL

  • Observabilidade

  • Registry

Vamos explorar cada um deles em detalhes.


1. Agent: O Coração do Sistema


O agente Ă© o nĂșcleo da arquitetura. Trata-se de uma aplicação como qualquer outra, que pode ser desenvolvida em diversas linguagens de programação. Atualmente, Python domina o cenĂĄrio, especialmente pela sua rica biblioteca de frameworks de IA. JavaScript e TypeScript tambĂ©m sĂŁo escolhas populares para agentes com interface web, rodando em Node.js.


Para sistemas que exigem alta performance e distribuição, Go tem ganhado cada vez mais espaço. Rust também aparece em cenårios onde segurança de memória é crítica, oferecendo garantias que outras linguagens não conseguem proporcionar.


2. LLM: O Cérebro da Operação


O Large Language Model Ă© o componente mais fundamental do agente. É ele que processa linguagem natural, entende contexto, raciocina sobre problemas e gera respostas inteligentes. Existem duas abordagens principais para usar LLMs:


Em Cloud (via API): Os mais comuns atualmente, como GPT, Claude e Gemini, oferecendo poder computacional sem necessidade de infraestrutura prĂłpria.


LLMs Locais (on-premise): Onde vocĂȘ executa o modelo na sua prĂłpria infraestrutura, garantindo maior controle sobre dados sensĂ­veis e custos previsĂ­veis.


Um aspecto interessante Ă© que frameworks como LangChain sĂŁo LLM-agnostic, permitindo que um Ășnico agente utilize mĂșltiplos modelos. Por exemplo, vocĂȘ pode usar o GPT para gerar respostas humanizadas e o Claude para geração de cĂłdigo, tudo dentro do mesmo agente.


3. MCP: Expandindo as Capacidades


Os MCPs (Model Context Protocol) representam a evolução do sistema de Tool Calling. Enquanto Tool Calling é simples mas limitado, o MCP oferece uma forma muito mais robusta de acessar sistemas externos.


Com MCP, seu agente pode buscar informaçÔes na web, ler e escrever arquivos, integrar com APIs e atĂ© executar cĂłdigos. É a ponte que conecta a inteligĂȘncia do LLM com o mundo real, permitindo que o agente nĂŁo apenas pense, mas tambĂ©m aja.


4. Memory: O Contexto que Då Sentido às AçÔes


Os LLMs possuem conhecimento geral sobre muitos assuntos, mas como fazĂȘ-los conhecer seus documentos especĂ­ficos, produtos ou polĂ­ticas internas? Como fazer o agente lembrar de conversas anteriores ou arquivos processados? É aqui que entra o sistema de memĂłria.


O funcionamento é elegante: todas as informaçÔes são transformadas em embeddings (vetores matemåticos) e armazenadas em um Vector Database. Isso permite que o sistema encontre documentos por similaridade semùntica, não apenas por palavras-chave.


Um exemplo prĂĄtico: se vocĂȘ perguntar "como cancelo minha assinatura", o agente consegue encontrar documentos que falam sobre "interromper serviço" ou "encerrar conta", mesmo sem usar a palavra "cancelar". Isso Ă© RAG (Retrieval-Augmented Generation) em ação.


Os Vector Databases mais utilizados incluem Pinecone, Qdrant e Weaviate, embora também seja possível usar Postgres, Elasticsearch e MongoDB para essa finalidade.


5. SubAgents: Dividir para Conquistar


Quando a quantidade de ferramentas e a complexidade das açÔes aumentam, os agentes começam a se confundir, usar ferramentas erradas e apresentar alucinaçÔes. A solução? SubAgentes.


Utilizar SubAgentes Ă© uma das formas mais eficazes de mitigar erros quando as responsabilidades de um Ășnico agente crescem. A ideia Ă© fazer uma segregação de funçÔes: um subagente cuida do sistema de pagamentos, outro dos clientes, outro apenas dos pedidos.


Esses SubAgentes podem estar dentro do agente principal ou serem serviços separados, em diferentes PODs do Kubernetes, por exemplo. Cada um terå seus próprios componentes (memória, MCPs e LLMs), embora possam compartilhar recursos comuns como o mesmo Vector Database.


6. Orchestration: Coordenando a Complexidade


Quando sua arquitetura cresce e vocĂȘ passa a ter mĂșltiplos agentes com workflows mais complexos, surge a necessidade de uma camada de orquestração. Ela coordena quem faz o quĂȘ, gerenciando a comunicação entre agentes e delegando tarefas de forma inteligente.


Frameworks como LangGraph e CrewAI são populares para agentes em Python, gerenciando padrÔes de colaboração. LangGraph também tem uma versão JavaScript, e para Rust existe o Swarms-rs.


Com essa camada, os agentes se tornam uma equipe autĂŽnoma onde cada um tem sua especialidade, trabalhando de forma coordenada para resolver problemas complexos.


7. HITL: Mantendo o Humano no Controle


Human-in-the-Loop (HITL) refere-se a processos onde um ser humano participa ativamente da operação, supervisão ou tomada de decisão de um sistema automatizado. Afinal, não då para simplesmente colocar a culpa na IA depois que ela toma uma decisão crítica equivocada.


O objetivo do HITL Ă© permitir que sistemas de IA alcancem a eficiĂȘncia da automação sem sacrificar a precisĂŁo e o raciocĂ­nio Ă©tico que apenas a supervisĂŁo humana pode garantir.


8. Observability: Visibilidade Total do Sistema


Para supervisionar um agente, vocĂȘ precisa ver o que ele estĂĄ fazendo. Diferente de logs tradicionais que apenas mostram "erro" ou "sucesso", observabilidade fornece informaçÔes detalhadas: qual ferramenta o agente chamou, que resposta o LLM retornou, quanto custou, quantos tokens utilizou, quanto tempo levou e, principalmente, por que ele tomou aquela decisĂŁo.


O que vocĂȘ deve rastrear:

  • Chamadas ao LLM: prompts enviados, tokens consumidos, custo e latĂȘncia

  • InteraçÔes entre agentes: em sistemas multi-agente, o fluxo de comunicação

  • Uso de MCPs: quais ferramentas foram chamadas e com quais parĂąmetros

  • Acesso Ă  memĂłria: buscas no Vector DB, cache hits/misses

  • Fluxo de decisĂŁo: o caminho percorrido atĂ© chegar na resposta


Ferramentas como LangSmith (nativa do ecossistema LangChain) e OpenLIT sĂŁo excelentes para observabilidade de agentes. O OpenLIT, em particular, oferece recursos adicionais como Prompt Hub (gerenciamento centralizado de prompts) e Vault (armazenamento seguro de API keys).


9. Registry: Governança em Escala


Quando sua arquitetura cresce significativamente - com dezenas de MCPs diferentes, vĂĄrios agentes especializados e mĂșltiplos LLMs - surge um desafio: como gerenciar tudo isso de forma segura e organizada?


O AI Asset Registry funciona como um catĂĄlogo inteligente da sua arquitetura. Hoje, a maioria dos registries sĂŁo bĂĄsicos (como o MCP Registry do GitHub), mas em ambientes corporativos vocĂȘ precisa de muito mais controle.


Um Registry ideal deveria oferecer:

  • InventĂĄrio completo de Tools/MCPs

  • Controle de acesso granular (ACL)

  • Sistema de permissĂ”es similar ao OAuth, mas para agentes

  • Registro de capacidades de cada agente

  • CatĂĄlogo de modelos disponĂ­veis

  • PolĂ­ticas de uso (rate limits, custos, compliance)

  • Auditoria completa (quem usou o quĂȘ, quando e por quĂȘ)


Na pråtica, é como um API Gateway, mas para agentes. Ferramentas como TrueFoundry AI Gateway, Credo AI, Collibra e Microsoft Entra Agent ID estão tentando resolver esse desafio, embora o mercado ainda esteja definindo os padrÔes de como isso deve funcionar.


ConclusĂŁo


A arquitetura de sistemas agĂȘnticos estĂĄ em constante evolução, refletindo a natureza dinĂąmica do campo de IA. Cada componente descrito aqui desempenha um papel crucial na construção de sistemas inteligentes, autĂŽnomos e confiĂĄveis.


À medida que essas tecnologias amadurecem, veremos o surgimento de padrĂ”es mais estabelecidos e ferramentas mais robustas. O futuro promete sistemas agĂȘnticos cada vez mais sofisticados, capazes de resolver problemas complexos mantendo a supervisĂŁo humana necessĂĄria para garantir decisĂ”es Ă©ticas e responsĂĄveis.


Para profissionais de tecnologia, entender essa arquitetura nĂŁo Ă© mais opcional - Ă© essencial para navegar no futuro da inteligĂȘncia artificial empresarial.

Aproveite para assistir um vĂ­deo que fizemos sobre este assunto:


bottom of page