Google lança Gemma 4: modelos de IA multimodais abertos com licença Apache 2.0 e recursos avançados

Google disponibiliza Gemma 4, nova geração de modelos de IA sob licença Apache 2.0

A Google anunciou o lançamento do Gemma 4, uma família de modelos de inteligência artificial com pesos abertos, que inclui variantes com 2 bilhões, 4 bilhões, 26 bilhões e 31 bilhões de parâmetros. A novidade é distribuída sob a licença Apache 2.0, permitindo uso, modificação e implementação comercial sem restrições, o que representa um avanço significativo para a comunidade de desenvolvedores e empresas que buscam soluções robustas e abertas em IA.

Modelos e arquitetura: diversidade para diferentes necessidades

A linha Gemma 4 contempla tanto modelos densos quanto modelos do tipo Mixture-of-Experts (MoE). O modelo denso de 31 bilhões de parâmetros destaca-se por alcançar desempenho comparável a modelos três a cinco vezes maiores, enquanto o modelo MoE de 26 bilhões ativa apenas 3,8 bilhões de parâmetros durante a inferência, garantindo maior velocidade na geração de tokens.

Além disso, há variantes menores, com 2 bilhões e 4 bilhões de parâmetros, voltadas para dispositivos móveis e IoT, que oferecem janelas de contexto de até 128 mil tokens, enquanto os modelos maiores suportam até 256 mil tokens, permitindo o processamento de grandes volumes de texto, como repositórios de código ou documentos extensos em uma única solicitação.

Recursos multimodais e capacidades avançadas

Uma das principais inovações do Gemma 4 é o suporte nativo a entrada e processamento de vídeo e imagens em todas as variantes. Os modelos menores também incorporam entrada de áudio para reconhecimento e compreensão de fala. A família foi treinada para compreender mais de 140 idiomas, ampliando seu alcance global.

O modelo de 31 bilhões de parâmetros alcançou 84,3% no benchmark GPQA Diamond e 80,0% no LiveCodeBench v6, indicadores que refletem melhorias substanciais em raciocínio científico e geração de código quando comparados ao Gemma 3 IT 27B, que obteve 42,4% no GPQA Diamond.

Integração com ferramentas e desenvolvimento de agentes autônomos

Os modelos Gemma 4 incluem suporte nativo para chamadas de função (function-calling), saída estruturada em JSON e instruções de sistema nativas. Essa combinação facilita a criação de agentes autônomos capazes de interagir com ferramentas externas, APIs e executar fluxos de trabalho complexos em múltiplas etapas de forma confiável.

Disponibilidade, acesso e ecossistema de suporte

Os pesos dos modelos estão disponíveis para download em plataformas como Hugging Face e Kaggle, com integração facilitada via vLLM, llama.cpp, Ollama, MLX, LM Studio, Unsloth, SGLang e NVIDIA NIM. Além disso, há um checkpoint quantizado NVFP4 do modelo 31B otimizado pelo NVIDIA Model Optimizer, que permite inferência mais eficiente em hardware menos potente.

Para incentivar a adoção e inovação, o Kaggle está promovendo o "Gemma 4 Good Challenge", um desafio para desenvolvedores criarem produtos que gerem impacto positivo significativo utilizando os novos modelos.

Impacto prático e perspectivas para desenvolvedores e empresas

O lançamento do Gemma 4 representa um marco para o desenvolvimento de IA multimodal com alta capacidade e flexibilidade, combinando desempenho de ponta com uma licença permissiva que elimina barreiras para uso comercial. A variedade de tamanhos e arquiteturas permite que empresas e desenvolvedores escolham o modelo mais adequado para suas demandas, seja para dispositivos de borda com restrições de recursos ou aplicações que exigem alta capacidade de processamento.

Especialistas da comunidade destacam que o valor do Gemma 4 está não apenas na performance, mas também na facilidade de integração e uso, fatores decisivos para ampla adoção no mercado norte-americano e global.