Voltar para o blog
Machine Learning

Cloudflare lança servidor MCP com Code Mode para otimizar uso de tokens em agentes de IA

16 de abril de 2026
12:09
APIDesenvolvimentoagentes de IAMCPCloudflareModel Context ProtocolSegurançaOrquestraçãoCode Modeotimização de tokens
Cloudflare lança servidor MCP com Code Mode para otimizar uso de tokens em agentes de IA

A Cloudflare apresentou uma inovação significativa para a interação de agentes de inteligência artificial com APIs complexas: o novo servidor Model Context Protocol (MCP) alimentado pelo Code Mode. Essa solução reduz drasticamente o custo de tokens ao acessar sua plataforma de APIs, facilitando a orquestração multi-API e ampliando as possibilidades para agentes baseados em grandes modelos de linguagem (LLMs).

O que é o servidor MCP com Code Mode?

O Model Context Protocol (MCP) é um padrão emergente que permite que LLMs se conectem a ferramentas externas e APIs por meio da exposição de definições estruturadas que o modelo pode chamar durante a execução. Tradicionalmente, cada endpoint de API correspondia a uma definição de ferramenta distinta, o que consumia muitos tokens no contexto do modelo, limitando sua capacidade de raciocínio.

A Cloudflare revolucionou esse modelo ao converter as ferramentas MCP em uma API TypeScript, permitindo que o LLM escreva código para interagir com ela. O Code Mode expõe apenas duas ferramentas principais — search() e execute() — suportadas por um SDK com tipagem, que possibilita a geração e execução segura de JavaScript dentro de um ambiente isolado V8.

Benefícios práticos e impacto para desenvolvedores

  • Redução drástica do uso de tokens: O Code Mode diminui o uso de tokens para interagir com mais de 2.500 endpoints da API Cloudflare de mais de 1,17 milhão para cerca de 1.000 tokens, uma redução de aproximadamente 99,9%.
  • Escalabilidade e eficiência: O tamanho fixo do contexto permite que agentes trabalhem com plataformas ricas em recursos sem esgotar o orçamento de tokens do modelo.
  • Orquestração avançada: O agente pode compilar planos em pequenos trechos de código que orquestram múltiplas operações na especificação OpenAPI, incluindo paginação, lógica condicional e chamadas encadeadas, tudo em um único ciclo.
  • Segurança reforçada: O código gerado é executado em um Dynamic Worker isolado, sem acesso a sistema de arquivos ou variáveis de ambiente, com controle rigoroso sobre requisições externas, mitigando riscos de execução de código não confiável.

Para quem é indicado e como acessar

O novo servidor MCP com Code Mode está disponível imediatamente para desenvolvedores que desejam integrar agentes de IA com a plataforma completa de APIs da Cloudflare, abrangendo serviços como DNS, Zero Trust, Workers e R2.

Além disso, a Cloudflare disponibilizou como open source o Code Mode SDK dentro do Agents SDK, permitindo que terceiros adotem padrões semelhantes em suas próprias implementações MCP.

Onde encontrar mais informações e recursos

Impacto no ecossistema de agentes de IA

Especialistas e profissionais de mercado consideram a abordagem da Cloudflare um avanço importante para escalar fluxos de trabalho agentic além de interações simples, permitindo automações complexas que envolvem múltiplas APIs. O método pode influenciar o desenvolvimento futuro de servidores MCP e frameworks de agentes, ajudando a mitigar custos de contexto e complexidade de orquestração em ambientes de produção.