GLM-5.2: guia prático da API compatível com OpenAI para raciocínio e function calling

O GLM-5.2, modelo da chinesa Zhipu AI, agora oferece uma API totalmente compatível com o formato OpenAI, permitindo que desenvolvedores aproveitem raciocínio profundo, function calling e recuperação de contexto longo sem adaptar seu código. Este guia prático mostra como usar o modelo em cenários reais.
Configuração multi-provedor
O GLM-5.2 está disponível em vários provedores compatíveis com OpenAI:
- Z.AI (oficial):
glm-5.2 - OpenRouter:
z-ai/glm-5.2 - Together AI:
zai-org/GLM-5.2 - Requesty:
zai/glm-5.2 - Hugging Face:
zai-org/GLM-5.2
A precificação é competitiva: US$ 1,40 por milhão de tokens de entrada e US$ 4,40 por milhão de tokens de saída.
Modos de raciocínio
O GLM-5.2 suporta três níveis de esforço de raciocínio:
- Thinking OFF: respostas rápidas e baratas, sem raciocínio visível
- Effort HIGH: raciocínio intermediário
- Effort MAX: raciocínio profundo máximo (padrão do modelo)
Em testes com problemas matemáticos, o modelo ajusta a profundidade do raciocínio conforme o parâmetro reasoning_effort, e o canal de raciocínio pode ser acessado separadamente via reasoning_content — permitindo inspecionar a cadeia de pensamento do modelo.
Function Calling e agentes
O GLM-5.2 implementa function calling no formato OpenAI padrão. Em um exemplo de agente multi-etapas, o modelo usou ferramentas para consultar populações de cidades e realizar cálculos — tudo sem alucinar números. O loop de ferramentas permite que o modelo execute múltiplas chamadas em sequência, recebendo resultados intermediários e refinando sua resposta.
Contexto longo e saída estruturada
O modelo também suporta JSON estruturado via response_format e recuperação de informações em contextos longos, sendo capaz de localizar fatos específicos em documentos extensos.
Com a API compatível com OpenAI, o GLM-5.2 se integra a qualquer código que já use o formato — basta trocar a base_url e a chave de API. Uma alternativa sólida para quem busca raciocínio profundo com custo controlado e flexibilidade de provedor.



