OpenAI lança suporte a WebSockets na Responses API para acelerar fluxos de trabalho com agentes Codex

Novidade na Responses API: WebSockets para maior agilidade em workflows agentic
A OpenAI anunciou uma importante atualização na Responses API, incorporando suporte a conexões WebSocket. Essa inovação visa otimizar os fluxos de trabalho que utilizam agentes Codex, reduzindo a sobrecarga da API e melhorando a latência dos modelos. O resultado prático é um desempenho mais ágil e eficiente para aplicações que dependem da interação contínua entre agentes e a API.
Como funciona o novo fluxo com WebSockets
Tradicionalmente, as interações com a API da OpenAI ocorriam via requisições HTTP, o que pode gerar latência e custos maiores devido à necessidade de reestabelecer conexões a cada chamada. Com o suporte a WebSockets, a conexão entre cliente e servidor permanece aberta, permitindo a troca contínua de mensagens em tempo real.
Além disso, a OpenAI implementou um mecanismo de cache escopado à conexão (connection-scoped caching), que armazena informações temporárias durante a sessão. Isso evita recomputações desnecessárias, acelerando o ciclo de respostas do agente Codex.
Quem pode se beneficiar e como acessar
O recurso é voltado para desenvolvedores e empresas que utilizam agentes baseados no Codex para automação de tarefas complexas, integração de sistemas ou desenvolvimento de assistentes inteligentes que demandam respostas rápidas e interativas.
Para utilizar o novo suporte a WebSockets na Responses API, é necessário ter acesso à API da OpenAI e consultar a documentação oficial para implementação. A OpenAI recomenda verificar se o ambiente de desenvolvimento suporta conexões WebSocket e ajustar o código para aproveitar o cache de conexão.
Disponibilidade e custo
A OpenAI disponibilizou o recurso para todos os usuários da Responses API sem custos adicionais específicos para o uso de WebSockets. Os preços continuam baseados no uso padrão da API, considerando o volume de tokens processados e outras métricas habituais.
Impacto prático para desenvolvedores
Com essa atualização, projetos que dependem de agentes Codex ganham em eficiência, podendo oferecer respostas mais rápidas e reduzir os custos operacionais relacionados a chamadas repetidas da API. Isso é especialmente relevante para aplicações em tempo real, como chatbots avançados, automações inteligentes e sistemas que exigem múltiplas interações seguidas.