Voltar para o blog
Notícias de IA

AI2 Lança MolmoWeb, Agente de IA Open Source para Executar Ações Online com Visão Computacional

24 de março de 2026
16:35
Automação InteligenteNavegadorinteligência artificialtecnologiaagentes de IADesenvolvimento de IAvisão computacionalIA open sourceMolmoWebAI2
AI2 Lança MolmoWeb, Agente de IA Open Source para Executar Ações Online com Visão Computacional

O laboratório de pesquisa AI2 (Allen Institute for AI) anunciou o lançamento do MolmoWeb, um agente de inteligência artificial open source capaz de executar tarefas diretamente no navegador e agir em nome dos usuários. A novidade chega em um momento em que cresce o interesse por agentes de IA que operam localmente nos dispositivos, ampliando a autonomia e personalização das interações automatizadas.

O que é o MolmoWeb e como funciona

MolmoWeb é um agente visual para web que automatiza tarefas no navegador utilizando IA multimodal, combinando visão computacional com capacidades de raciocínio para interpretar e agir sobre o conteúdo exibido na tela do computador do usuário. Construído sobre a família de modelos Molmo 2 desenvolvida pelo AI2, o agente está disponível em dois tamanhos de modelo, com 4 bilhões e 8 bilhões de parâmetros.

Imagem relacionada ao artigo de AI Business
Imagem de apoio da materia original.

Além do agente, o AI2 disponibilizou o conjunto de dados de treinamento MolmoWebMix, ferramentas de avaliação e uma biblioteca de inferência para que desenvolvedores e pesquisadores possam hospedar localmente, ajustar e aprimorar o sistema conforme suas necessidades.

Contexto e comparação com outras soluções

O lançamento do MolmoWeb ocorre um dia após a Anthropic atualizar seu assistente Claude com a capacidade de controlar computadores pessoais, permitindo que o agente realize ações como abrir arquivos, navegar em páginas e executar ferramentas de desenvolvimento automaticamente. Enquanto a solução da Anthropic é proprietária, o MolmoWeb se destaca por ser open source, promovendo maior transparência e acesso da comunidade à tecnologia.

Segundo Arun Chandrasekaran, analista da Gartner, o MolmoWeb representa uma inovação importante por permitir o estudo aberto do comportamento e das decisões de agentes autônomos, o que é essencial para o desenvolvimento de sistemas seguros no futuro.

Imagem relacionada ao artigo de AI Business
Imagem de apoio da materia original.

Aplicações práticas e público-alvo

MolmoWeb surge como uma opção para empresas e pesquisadores que buscam explorar agentes de IA com maior controle e personalização, especialmente aquelas que preferem soluções open source para reduzir custos e evitar dependência de fornecedores proprietários. Chris Callison-Burch, professor da Universidade da Pensilvânia e pesquisador visitante no AI2, destaca que o uso de modelos abertos pode ser uma estratégia de entrada para muitas organizações interessadas em agentes inteligentes.

Desafios e limitações atuais

Apesar das potencialidades, o MolmoWeb enfrenta desafios técnicos significativos. Por depender de visão computacional para interpretar o ambiente do computador, o agente pode ser confundido por situações como rolagem da página antes do carregamento completo. Além disso, não foi treinado para tarefas que envolvam login financeiro e seu desempenho diminui diante de instruções ambíguas.

O AI2 reconhece essas limitações, mas aposta que a abertura dos dados e ferramentas permitirá que a comunidade avance na superação desses obstáculos, aprimorando a robustez e segurança do agente.

Como acessar e contribuir

O MolmoWeb está disponível para download e uso no GitHub e na plataforma Hugging Face, onde interessados podem acessar o código-fonte, conjuntos de dados e documentação para iniciar experimentos e personalizações.

Links úteis