Cloudflare lança Agent Memory: serviço gerenciado de memória persistente para agentes de IA

Cloudflare apresenta Agent Memory em beta privado
A Cloudflare anunciou o lançamento do Agent Memory, um serviço gerenciado de memória persistente para agentes de inteligência artificial (IA), atualmente em beta privado. A novidade foi divulgada durante a Agents Week da empresa e promete revolucionar a forma como agentes de IA lidam com a retenção e recuperação de informações ao longo do tempo.
Como funciona o Agent Memory
Ao contrário de simplesmente inserir todas as informações no contexto imediato de uma conversa, o Agent Memory extrai memórias estruturadas das interações dos agentes e as armazena para recuperação sob demanda. O sistema utiliza uma arquitetura de recuperação paralela com cinco canais que combinam resultados por meio da técnica Reciprocal Rank Fusion (RRF), garantindo que apenas as informações relevantes sejam utilizadas em cada consulta.
O processo de ingestão das memórias envolve duas passagens paralelas: uma ampla, que fragmenta o conteúdo em blocos de aproximadamente 10 mil caracteres, e outra detalhada, que foca em valores concretos, como nomes, preços e versões. Antes de armazenar, as memórias passam por oito verificações para classificação em quatro categorias principais: fatos, eventos, instruções e tarefas.
Além disso, o Agent Memory oferece o recurso de perfis de memória compartilhados, permitindo que equipes de agentes acessem um conhecimento comum. Isso é especialmente útil para uniformizar convenções, decisões arquiteturais e conhecimento tácito dentro de times de desenvolvimento. A Cloudflare já utiliza internamente essa funcionalidade, por exemplo, para que um agente de revisão de código aprenda a evitar alertas repetitivos previamente ignorados pelos autores.
Quem pode usar e como acessar
Atualmente, o Agent Memory está disponível em beta privado para desenvolvedores que constroem agentes na plataforma da Cloudflare. Interessados podem entrar na lista de espera oficial para obter acesso.
Impacto prático e diferenciais técnicos
O lançamento do Agent Memory responde a desafios reais enfrentados por agentes de IA que operam por semanas ou meses em ambientes produtivos, onde a qualidade da memória tende a degradar com o aumento do contexto — fenômeno conhecido como "context rot". Pesquisas indicam que modelos de linguagem funcionam melhor com um contexto menor, porém mais relevante, o que torna a memória um diferencial de qualidade e não apenas um recurso de armazenamento.
De acordo com especialistas, o Agent Memory representa uma mudança de paradigma, onde a memória deixa de ser apenas uma característica do modelo de IA para se tornar uma infraestrutura crítica, com gerenciamento de ciclo de vida, verificação e isolamento.
Entre os diferenciais técnicos do serviço estão a distribuição na borda (edge computing), integração com as primitivas de computação da Cloudflare (como Durable Objects, Vectorize e Workers AI) e a arquitetura de recuperação multi-canal. Para extração e classificação, a Cloudflare utiliza o modelo Llama 4 Scout (17B MoE), enquanto o modelo Nemotron 3 (120B MoE) é empregado exclusivamente na síntese das respostas.
Concorrência e mercado
O mercado de memórias para agentes de IA está crescendo e conta com concorrentes como Mem0, Zep, LangMem e Letta. O que distingue o Agent Memory da Cloudflare é sua forte integração com a infraestrutura de computação na borda e a capacidade de compartilhamento de memórias entre agentes, algo que potencializa a colaboração em equipes.
Considerações para adoção
Especialistas alertam para alguns cuidados ao adotar serviços de memória para agentes, como o risco de vendor lock-in e a dependência de modelos secundários para extração, que podem não estar sob controle total dos desenvolvedores. Recomenda-se o uso explícito da ferramenta de "lembrar" para fatos críticos e a separação clara entre histórico de conversas e fatos aprendidos na arquitetura dos agentes.