MiniMax lança MSA: atenção esparsa treinada em modelo de 109B parâmetros com 3 trilhões de tokens
A MiniMax acaba de lançar o MSA (MiniMax Sparse Attention) , um novo mecanismo de atenção esparsa que resolve um dos gargalos…
205 publicações encontradas
A MiniMax acaba de lançar o MSA (MiniMax Sparse Attention) , um novo mecanismo de atenção esparsa que resolve um dos gargalos…
Inspiração e objetivo inicial do projeto O projeto Amazing Digital Dentures foi inspirado na série animada The Amazing Digital Circus, que apresenta…
O Her · हेर é uma ferramenta inovadora lançada na plataforma Hugging Face que atua como uma verdadeira detetive para sessões do…
Lançamento do NVIDIA Nemotron 3 Ultra no Amazon SageMaker JumpStart A AWS anunciou a disponibilidade imediata do modelo NVIDIA Nemotron 3 Ultra…
Amazon Nova Forge: Personalização Precisa para Modelos de Linguagem Amazon Nova Forge é a nova solução da AWS que permite customizar modelos…
Para quem trabalha com grandes modelos de linguagem (LLMs) em instâncias GPU da AWS, o tempo de carregamento do modelo na memória…
Mellum2: inovação em modelos de linguagem focados em eficiência O JetBrains, em parceria com a Hugging Face, acaba de lançar o Mellum2,…
Otari: o gateway open source que integra modelos de IA Em um cenário onde o custo e a privacidade são cada vez…
A Azercell Telecom LLC, principal operadora de telecomunicações do Azerbaijão, em parceria com o AWS Generative AI Innovation Center, desenvolveu um…
Erros de ortografia surpreendem em IA do Google Recentemente, a inteligência artificial (IA) integrada ao mecanismo de busca do Google tem…
Em uma parceria entre a Artificial Analysis e o IBM Research, foi lançado o ITBench-AA, o primeiro benchmark focado em avaliar modelos…
Nemotron-Labs Diffusion: inovação em geração de texto com modelos de difusão A NVIDIA, em parceria com a HuggingFace, apresenta o Nemotron-Labs…