Z.ai Lança GLM-5.2: Contexto de 1 Milhão de Tokens e Dois Níveis de Raciocínio

A Z.ai acaba de lançar o GLM-5.2, a quarta iteração da linha GLM-5 em apenas quatro meses, trazendo um salto impressionante: 1 milhão de tokens de contexto utilizável e dois níveis de esforço de raciocínio. O modelo já está disponível para todos os planos do GLM Coding (Lite, Pro, Max, Team).
Contexto de 1 Milhão de Tokens
A variante glm-5.2[1m] oferece uma janela de contexto de 1.000.000 de tokens, aproximadamente 5 vezes maior que os 200K do GLM-5.1. Isso permite que um agente de codificação mantenha um repositório inteiro de médio porte (código-fonte, testes, configurações, histórico) na memória de trabalho, eliminando a necessidade de sumarização constante.
Cada resposta pode retornar até 131.072 tokens de saída, uma capacidade massiva para tarefas complexas.
Dois Níveis de Esforço de Raciocínio
O GLM-5.2 introduz dois modos de raciocínio:
- High — para tarefas padrão
- Max — recomendado para trabalhos de codificação complexos e em múltiplas etapas
No Claude Code, o esforço pode ser configurado via /effort. As opções xhigh, max e ultracode são mapeadas para o modo Max do GLM-5.2.
Arquitetura
A Z.ai não divulgou a arquitetura exata do GLM-5.2 no lançamento, mas a comunidade aponta que a base GLM-5 é um modelo Mixture-of-Experts de 744 bilhões de parâmetros, ativando 40 bilhões por token. O GLM-5.1 manteve a mesma espinha dorsal com pós-treinamento redirecionado.
Sem Benchmarks no Lançamento
Um ponto curioso: nenhum benchmark foi publicado no lançamento. A Z.ai optou por focar em disponibilidade, contexto e no roadmap open-source. Números de SWE-bench, Terminal-Bench ou Code Arena ainda estão pendentes.
Casos de Uso
- Refatoração de repositórios inteiros — carregue um repo de 40 arquivos Python em uma única sessão
- Execuções de agentes de longa duração — ciclos sustentados de planejar-executar-testar-corrigir; o GLM-5.1 sustentou ~1.700 passos de agente por até 8 horas
- Substituição direta do Claude Code — troque apenas a URL base e o identificador do modelo
- Análise de documentos extensos — alimente especificações, logs ou transcrições além de 200K tokens sem truncamento
Open Source e Licença MIT
O modelo será liberado sob licença MIT, com pesos pendentes para a próxima semana — seguindo a tradição de abertura da Z.ai com a linha GLM-5.
Compatibilidade
O GLM-5.2 é compatível desde o primeiro dia com Claude Code, Cline, OpenCode e OpenClaw (8 ferramentas no total), utilizando um endpoint compatível com a API Anthropic por meio de uma simples troca de URL base e modelo.
A Z.ai continua sua trajetória agressiva de lançamentos, posicionando o GLM-5.2 como uma alternativa open-source viável para codificação assistida por IA em larga escala.