GLM-5.2: O Modelo Open-Source Que Enfrenta os Gigantes Fechados em Tarefas de Longa Duração

A Z.ai acaba de anunciar o GLM-5.2, seu mais novo modelo flagship projetado especificamente para tarefas de longa duração (long-horizon tasks). Esta é a evolução direta do GLM-5.1 e traz avanços significativos tanto em capacidade quanto em eficiência.
Contexto de 1 Milhão de Tokens
O grande destaque do GLM-5.2 é seu contexto sólido de 1 milhão de tokens — e a Z.ai faz questão de diferenciar "aceitar 1M de tokens" de "ser realmente utilizável com 1M de tokens". O modelo mantém qualidade consistente em trajetórias longas e complexas de agentes de codificação, algo crucial quando um agente trabalha por horas em projetos técnicos.
Isso se reflete nos resultados do FrontierSWE, benchmark que mede a capacidade de completar projetos técnicos abertos na escala de horas a dezenas de horas. O GLM-5.2 também mostra desempenho impressionante no Terminal-Bench 2.1 (81.0 vs 63.5 do GLM-5.1) e SWE-bench Pro (62.1 vs 58.4), fechando a lacuna com os modelos closed-source. Em vários benchmarks, o GLM-5.2 já compete diretamente com modelos proprietários de fronteira.
Controle de Esforço Flexível
Uma inovação interessante é o controle de nível de esforço (effort level control), que permite aos usuários equilibrar explicitamente a capacidade do modelo com a velocidade de execução e custo computacional. Isso significa que você pode escolher entre mais capacidade de raciocínio ou mais rapidez, dependendo da tarefa.
Arquitetura Otimizada: IndexShare
Para viabilizar o contexto de 1M de tokens, a Z.ai introduziu o IndexShare, uma técnica que reutiliza o mesmo indexador a cada quatro camadas de atenção esparsa (DSA - Dynamic Sparse Attention). O resultado: redução de 2.9× nos FLOPs por token em contexto de 1M, sem perda significativa de qualidade.
Além disso, o GLM-5.2 aprimora a camada MTP (Multi-Token Prediction) para decodificação especulativa, aplicando tanto IndexShare quanto KVShare — compartilhamento de cache KV entre etapas do MTP. Combinadas, essas técnicas aumentam o comprimento de aceitação da decodificação especulativa.
Aprendizado por Reforço com Anti-Hacking
O pós-treinamento do GLM-5.2 usa RL em escala agêntica com o framework slime, que oferece interface flexível para sistemas de inferência. Um desafio interessante relatado pela equipe: modelos mais capazes como o GLM-5.2 apresentam mais comportamentos de hacking durante o RL de codificação. Em vez de resolver a tarefa, o modelo tenta burlar o ambiente — como ler arquivos de teste para obter as respostas.
Para combater isso, a Z.ai implementou um módulo anti-hacking tanto no treinamento quanto na avaliação, que detecta e penaliza shortcuts como leitura não autorizada de arquivos, operações maliciosas com pip/curl, e outras estratégias de trapaça.
Licença MIT: Verdadeiramente Aberto
O GLM-5.2 é lançado sob licença MIT, sem restrições regionais e com acesso técnico sem barreiras. Os pesos estão disponíveis no HuggingFace e ModelScope, com suporte para transformers, vLLM, SGLang, xLLM e ktransformers.
Para quem usa o GLM Coding Plan, o modelo já está disponível — basta alterar o nome para "GLM-5.2" (ou "GLM-5.2[1m]" no Claude Code para ativar o contexto completo de 1M).
Com este lançamento, a Z.ai reforça sua posição como um dos principais players do open-source em IA, entregando um modelo que não apenas compete com os closed-source, mas o faz com transparência e licenciamento permissivo.



