Plataforma Gemini Enterprise Agent e Agentic RAG: Avanços em Respostas Confiáveis para Consultas Empresariais Complexas

Desafio das Respostas Confiáveis em Ambientes Empresariais Multidados

Os sistemas tradicionais de retrieval-augmented generation (RAG) enfrentam limitações ao lidar com consultas complexas que exigem múltiplas buscas em diferentes bases de dados. Por exemplo, uma pergunta sobre as especificações do servidor usado em um projeto pode retornar apenas um ID de servidor sem detalhar suas características, devido à fragmentação da informação em "ilhas" de dados. Isso gera respostas parciais ou negativas, comprometendo a confiabilidade.

Agentic RAG: Uma Abordagem Multiagente Iterativa

O Google Research, em colaboração com o Google Cloud, desenvolveu o Agentic RAG, um framework multiagente que supera as limitações dos modelos RAG convencionais. O sistema divide a consulta complexa em múltiplas etapas, planejando e executando buscas iterativas para garantir que o contexto coletado seja suficiente para uma resposta precisa.

Arquitetura Multiagente e Fluxo de Trabalho

Orchestrator: Avalia a complexidade da consulta e delega tarefas aos agentes especializados.
Planner Agent: Mapeia os caminhos da informação, definindo a ordem das buscas, como consultar primeiro o banco financeiro e depois o de gestão de projetos.
Query Rewriter: Reescreve a consulta original em múltiplas perguntas específicas e otimizadas para busca.
Search Fanout Agent: Executa as buscas nos diferentes repositórios, coletando trechos relevantes.
Large Language Model (LLM): Consolida os dados recuperados para gerar a resposta final.

Diferenciais do Agentic RAG: Persistência e Controle de Qualidade

O grande diferencial do Agentic RAG é a presença do Sufficient Context Agent, um agente que atua como um inspetor de qualidade. Ele avalia se os trechos recuperados e o rascunho da resposta contêm todas as informações necessárias. Caso detecte lacunas, o agente especifica exatamente o que falta e orienta novas buscas, evitando respostas incompletas ou meramente negativas.

Exemplo Prático: Consulta Médica Complexa

Imagine um médico consultando sobre as medicações, restrições alimentares e reações alérgicas de um paciente após uma cirurgia, com critérios específicos para exclusões. O Agentic RAG segmenta a consulta, busca em bases distintas (farmácia, nutrição, notas clínicas), verifica se os dados estão completos e, se faltar informação, realiza buscas adicionais até garantir uma resposta fundamentada e confiável.

Resultados de Benchmark e Avaliação

O sistema foi testado no conjunto FramesQA, que exige múltiplos passos para responder perguntas, como comparar durações de episódios de séries populares. O Agentic RAG obteve até 34% mais precisão em datasets de factualidade, superando o RAG convencional. Em cenários com múltiplos corpora (bases de dados distintas), o sistema manteve alta acurácia (90,1%) e latência semelhante ao cenário de corpus único, demonstrando capacidade robusta de raciocínio e roteamento entre fontes heterogêneas.

Limitações e Perspectivas Futuras

Embora o Agentic RAG aumente a confiabilidade das respostas, a complexidade do sistema implica maior custo computacional e necessidade de ajuste fino para diferentes domínios. A pesquisa abre caminho para sistemas de IA mais auditáveis, rastreáveis e fundamentados, com potencial para transformar fluxos de trabalho empresariais e clínicos.

Disponibilidade e Recursos

O Agentic RAG está disponível em pré-visualização pública na Gemini Enterprise Agent Platform. Documentações técnicas detalhadas sobre o RAG Engine Cross Corpus Retrieval e o motor RAG podem ser consultadas para implementação e testes. Para desenvolvedores interessados, o repositório do Google Research está disponível em GitHub. Além disso, o Google Labs oferece experimentos interativos com IA em labs.google.