Cohere lança modelo de voz open-source para transcrição em 14 idiomas com alta precisão

Cohere apresenta Transcribe: modelo open-source para reconhecimento automático de voz
A empresa especializada em inteligência artificial para o mercado corporativo, Cohere, anunciou o lançamento do seu primeiro modelo de voz: Transcribe. Trata-se de um modelo open-source focado em reconhecimento automático de fala (ASR) para tarefas como anotações e análise de áudio.
Modelo leve e acessível para uso próprio
Com apenas 2 bilhões de parâmetros, Transcribe é relativamente leve, projetado para rodar em GPUs de nível consumidor. Isso significa que desenvolvedores e empresas que preferem hospedar suas próprias soluções podem fazê-lo sem a necessidade de infraestrutura pesada ou especializada.

Suporte a 14 idiomas e desempenho superior
O modelo suporta 14 idiomas atualmente: inglês, francês, alemão, italiano, espanhol, português, grego, holandês, polonês, chinês, japonês, coreano, vietnamita e árabe. De acordo com a Cohere, Transcribe supera modelos concorrentes como Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 e Qwen3-ASR-1.7B Speech no ranking Hugging Face Open ASR leaderboard, alcançando uma taxa média de erro por palavra (WER) de 5,42, a menor entre os modelos avaliados.
Em avaliações humanas, Transcribe obteve uma taxa média de vitória de 61% frente a outros modelos em aspectos como precisão, coerência e usabilidade das transcrições. No entanto, o modelo apresentou desempenho inferior em transcrições nas línguas portuguesa, alemã e espanhola.
Alta velocidade de processamento e planos de integração
Outro destaque é a velocidade de processamento: Transcribe é capaz de transcrever 525 minutos de áudio em apenas um minuto, um desempenho elevado para sua categoria. A Cohere planeja integrar o modelo à sua plataforma de orquestração de agentes empresariais, North, ampliando as possibilidades de uso corporativo.
Disponibilidade gratuita via API e plataforma gerenciada
O modelo está disponível gratuitamente por meio da API da Cohere, acessível no dashboard oficial. Além disso, Transcribe será disponibilizado na plataforma de inferência gerenciada Model Vault, facilitando o uso para desenvolvedores e empresas que buscam uma solução pronta para implementação.
Impacto prático para usuários e desenvolvedores
Com a popularização de aplicativos de anotações e ditado, como Granola e Wispr Flow, a demanda por modelos eficientes de reconhecimento de voz cresce rapidamente. Transcribe surge como uma opção robusta e acessível para quem busca qualidade e flexibilidade, seja para projetos pessoais, startups ou grandes corporações.