JetBrains lança Mellum2: modelo Mixture-of-Experts de 12 bilhões de parâmetros para texto e código

Mellum2: inovação em modelos de linguagem focados em eficiência

O JetBrains, em parceria com a Hugging Face, acaba de lançar o Mellum2, um modelo de inteligência artificial do tipo Mixture-of-Experts (MoE) com 12 bilhões de parâmetros. Diferente de modelos convencionais, Mellum2 ativa apenas 2,5 bilhões de parâmetros por token, o que garante uma inferência rápida e eficiente, ideal para aplicações de alta demanda e baixa latência.

Para quem o Mellum2 é indicado?

Este modelo foi treinado do zero para lidar com tarefas envolvendo tanto linguagem natural quanto código, tornando-o especialmente útil para desenvolvedores, equipes de engenharia de software e empresas que buscam integrar IA em seus fluxos de trabalho. Entre os principais usos estão:

Imagem relacionada ao artigo de HuggingFace — Imagem de apoio da materia original.

Roteamento e orquestração: classificação de prompts, seleção de ferramentas e controle de fluxo dentro de sistemas multi-modelos.
Pipelines RAG (Retrieval-Augmented Generation): compressão de contexto, sumarização e pós-processamento de informações recuperadas.
Sub-agentes: planejamento, validação e transformação de dados em etapas intermediárias, reduzindo a necessidade de modelos maiores para cada tarefa.
Implantações privadas: por ser open source e eficiente, pode ser usado em ambientes self-hosted que lidam com código proprietário ou dados internos.

Diferenciais técnicos e desempenho

O Mellum2 utiliza a arquitetura Mixture-of-Experts, que mantém uma alta capacidade total do modelo, mas ativa apenas uma fração dos parâmetros para cada token processado. Isso resulta em:

Inferência mais rápida: mais de duas vezes mais veloz que modelos abertos de tamanho similar.
Eficiência de recursos: menor custo operacional em workloads em tempo real.
Foco especializado: dedicado a texto e código, evitando a complexidade e o peso dos modelos multimodais.

Os benchmarks apresentados no relatório técnico (disponível no arXiv) mostram que Mellum2 é competitivo em tarefas de geração de código, raciocínio, ciência e matemática.

Licença, acesso e como começar a usar

Mellum2 é disponibilizado sob a licença Apache 2.0, o que permite seu uso livre e modificações conforme as necessidades do usuário. Para acessar o modelo, basta visitar a coleção oficial no Hugging Face:

https://huggingface.co/collections/JetBrains/mellum-2

Quem ainda não possui conta pode se cadastrar gratuitamente em:

https://huggingface.co/join

Além disso, a documentação completa para integração, uso e detalhes técnicos está disponível em:

https://huggingface.co/docs

Impacto prático para desenvolvedores e empresas

À medida que sistemas de IA se tornam mais complexos, a tendência é a composição de múltiplos modelos especializados para tarefas específicas. Mellum2 se posiciona como um modelo rápido e focado, ideal para ser o “núcleo” em sistemas que requerem alta frequência de chamadas, como:

Redução de custos e latência em pipelines de processamento de linguagem natural e código.
Melhoria na orquestração de modelos, evitando o uso desnecessário de grandes modelos para tarefas simples.
Facilidade de implantação em ambientes privados, garantindo segurança e controle sobre dados sensíveis.

Com isso, Mellum2 contribui para tornar sistemas de IA mais rápidos, econômicos e fáceis de gerenciar, especialmente em contextos corporativos e de engenharia de software.