Z.ai Lança GLM-5.2: Contexto de 1 Milhão de Tokens e Dois Níveis de Raciocínio

A Z.ai acaba de lançar o GLM-5.2, a quarta iteração da linha GLM-5 em apenas quatro meses, trazendo um salto impressionante: 1 milhão de tokens de contexto utilizável e dois níveis de esforço de raciocínio. O modelo já está disponível para todos os planos do GLM Coding (Lite, Pro, Max, Team).

Contexto de 1 Milhão de Tokens

A variante glm-5.2[1m] oferece uma janela de contexto de 1.000.000 de tokens, aproximadamente 5 vezes maior que os 200K do GLM-5.1. Isso permite que um agente de codificação mantenha um repositório inteiro de médio porte (código-fonte, testes, configurações, histórico) na memória de trabalho, eliminando a necessidade de sumarização constante.

Cada resposta pode retornar até 131.072 tokens de saída, uma capacidade massiva para tarefas complexas.

Dois Níveis de Esforço de Raciocínio

O GLM-5.2 introduz dois modos de raciocínio:

High — para tarefas padrão
Max — recomendado para trabalhos de codificação complexos e em múltiplas etapas

No Claude Code, o esforço pode ser configurado via /effort. As opções xhigh, max e ultracode são mapeadas para o modo Max do GLM-5.2.

Arquitetura

A Z.ai não divulgou a arquitetura exata do GLM-5.2 no lançamento, mas a comunidade aponta que a base GLM-5 é um modelo Mixture-of-Experts de 744 bilhões de parâmetros, ativando 40 bilhões por token. O GLM-5.1 manteve a mesma espinha dorsal com pós-treinamento redirecionado.

Sem Benchmarks no Lançamento

Um ponto curioso: nenhum benchmark foi publicado no lançamento. A Z.ai optou por focar em disponibilidade, contexto e no roadmap open-source. Números de SWE-bench, Terminal-Bench ou Code Arena ainda estão pendentes.

Casos de Uso

Refatoração de repositórios inteiros — carregue um repo de 40 arquivos Python em uma única sessão
Execuções de agentes de longa duração — ciclos sustentados de planejar-executar-testar-corrigir; o GLM-5.1 sustentou ~1.700 passos de agente por até 8 horas
Substituição direta do Claude Code — troque apenas a URL base e o identificador do modelo
Análise de documentos extensos — alimente especificações, logs ou transcrições além de 200K tokens sem truncamento

Open Source e Licença MIT

O modelo será liberado sob licença MIT, com pesos pendentes para a próxima semana — seguindo a tradição de abertura da Z.ai com a linha GLM-5.

Compatibilidade

O GLM-5.2 é compatível desde o primeiro dia com Claude Code, Cline, OpenCode e OpenClaw (8 ferramentas no total), utilizando um endpoint compatível com a API Anthropic por meio de uma simples troca de URL base e modelo.

A Z.ai continua sua trajetória agressiva de lançamentos, posicionando o GLM-5.2 como uma alternativa open-source viável para codificação assistida por IA em larga escala.