Cohere lança modelo de voz open-source para transcrição em 14 idiomas com alta precisão

Cohere apresenta Transcribe: modelo open-source para reconhecimento automático de voz

A empresa especializada em inteligência artificial para o mercado corporativo, Cohere, anunciou o lançamento do seu primeiro modelo de voz: Transcribe. Trata-se de um modelo open-source focado em reconhecimento automático de fala (ASR) para tarefas como anotações e análise de áudio.

Modelo leve e acessível para uso próprio

Com apenas 2 bilhões de parâmetros, Transcribe é relativamente leve, projetado para rodar em GPUs de nível consumidor. Isso significa que desenvolvedores e empresas que preferem hospedar suas próprias soluções podem fazê-lo sem a necessidade de infraestrutura pesada ou especializada.

Imagem relacionada ao artigo de TechCrunch AI — Imagem de apoio da materia original.

Suporte a 14 idiomas e desempenho superior

O modelo suporta 14 idiomas atualmente: inglês, francês, alemão, italiano, espanhol, português, grego, holandês, polonês, chinês, japonês, coreano, vietnamita e árabe. De acordo com a Cohere, Transcribe supera modelos concorrentes como Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 e Qwen3-ASR-1.7B Speech no ranking Hugging Face Open ASR leaderboard, alcançando uma taxa média de erro por palavra (WER) de 5,42, a menor entre os modelos avaliados.

Em avaliações humanas, Transcribe obteve uma taxa média de vitória de 61% frente a outros modelos em aspectos como precisão, coerência e usabilidade das transcrições. No entanto, o modelo apresentou desempenho inferior em transcrições nas línguas portuguesa, alemã e espanhola.

Alta velocidade de processamento e planos de integração

Outro destaque é a velocidade de processamento: Transcribe é capaz de transcrever 525 minutos de áudio em apenas um minuto, um desempenho elevado para sua categoria. A Cohere planeja integrar o modelo à sua plataforma de orquestração de agentes empresariais, North, ampliando as possibilidades de uso corporativo.

Disponibilidade gratuita via API e plataforma gerenciada

O modelo está disponível gratuitamente por meio da API da Cohere, acessível no dashboard oficial. Além disso, Transcribe será disponibilizado na plataforma de inferência gerenciada Model Vault, facilitando o uso para desenvolvedores e empresas que buscam uma solução pronta para implementação.

Impacto prático para usuários e desenvolvedores

Com a popularização de aplicativos de anotações e ditado, como Granola e Wispr Flow, a demanda por modelos eficientes de reconhecimento de voz cresce rapidamente. Transcribe surge como uma opção robusta e acessível para quem busca qualidade e flexibilidade, seja para projetos pessoais, startups ou grandes corporações.

Cohere lança modelo de voz open-source para transcrição em 14 idiomas com alta precisão

Cohere apresenta Transcribe: modelo open-source para reconhecimento automático de voz

Modelo leve e acessível para uso próprio

Suporte a 14 idiomas e desempenho superior

Alta velocidade de processamento e planos de integração

Disponibilidade gratuita via API e plataforma gerenciada

Impacto prático para usuários e desenvolvedores

Links úteis

Leia também

Tokenpocalypse: o desafio dos custos e preços na era das grandes empresas de IA

Nova ferramenta de IA identifica tráfico ilegal de cavalos-marinhos e barbatanas de tubarão

Laboratórios Chineses de Peptídeos Financiados por Criptomoedas Crescem Rapidamente

Prefeito de Shelbyville, Indiana, gera polêmica ao criticar moradores contrários a data center bilionário