Voltar para o blog
Notícias de IA

Microsoft lança três modelos de IA multimodais para competir no mercado global

2 de abril de 2026
14:49
MicrosofttecnologiaIA empresarialmodelos multimodaisMAI-Voice-1MAI-Image-2Mustafa SuleymanInteligência ArtificialMAI-Transcribe-1
Microsoft lança três modelos de IA multimodais para competir no mercado global

Na última quinta-feira, a Microsoft AI, laboratório de pesquisa da gigante tecnológica, anunciou o lançamento de três novos modelos fundamentais de inteligência artificial capazes de gerar texto, voz e imagens. Essa iniciativa reforça a estratégia da empresa de construir uma pilha própria de modelos multimodais e disputar espaço com concorrentes como Google e OpenAI, mesmo mantendo parceria com esta última.

Os três modelos lançados e suas funcionalidades

  • MAI-Transcribe-1: modelo de transcrição de voz para texto, que suporta 25 idiomas e é 2,5 vezes mais rápido que a solução Azure Fast da Microsoft.
  • MAI-Voice-1: modelo para geração de áudio, capaz de produzir 60 segundos de voz em apenas 1 segundo, além de permitir a criação de vozes personalizadas.
  • MAI-Image-2: modelo para geração de vídeos, que já estava disponível no MAI Playground desde 19 de março e agora integra o Microsoft Foundry.

Quem pode usar e como acessar os modelos

Todos os três modelos estão disponíveis na plataforma Microsoft Foundry, enquanto os modelos de transcrição e voz também podem ser testados diretamente no MAI Playground, ambiente de experimentação de grandes modelos de linguagem da Microsoft.

Imagem relacionada ao artigo de TechCrunch AI
Imagem de apoio da materia original.

Preços e custos de uso

  • MAI-Transcribe-1: a partir de US$ 0,36 por hora de uso.
  • MAI-Voice-1: US$ 22 para cada 1 milhão de caracteres gerados.
  • MAI-Image-2: US$ 5 por 1 milhão de tokens de entrada de texto e US$ 33 por 1 milhão de tokens de saída de imagem.

Contexto da equipe e visão da Microsoft AI

Os modelos foram desenvolvidos pelo time MAI Superintelligence, liderado por Mustafa Suleyman, CEO da Microsoft AI, que foi criado em novembro de 2025. Em sua declaração oficial, Suleyman destacou que a Microsoft está focada em construir uma "IA Humanista", que coloca as pessoas no centro do desenvolvimento, priorizando a comunicação prática e utilizável no dia a dia.

Apesar do lançamento dos seus próprios modelos, Suleyman reafirmou o compromisso da Microsoft com a parceria estratégica com a OpenAI, que inclui um investimento superior a US$ 13 bilhões e integração dos modelos em diversos produtos da empresa.

Impacto prático para usuários e empresas

Com esses lançamentos, a Microsoft busca oferecer soluções de IA multimodal mais acessíveis e eficientes, ampliando as possibilidades para desenvolvedores, empresas e usuários finais que necessitam de tecnologias avançadas para transcrição, geração de voz e imagens. A promessa de preços mais competitivos em relação aos concorrentes pode impulsionar a adoção dessas ferramentas em larga escala.

Links úteis