Voltar para artigos
Notícias de Tecnologia

Gemini 3.5 Flash ganha 'computer use' nativo e promete agentes de IA mais autônomos

24 de junho de 2026
15:28
google-deepmindagentes-de-iageminicomputer-use
Gemini 3.5 Flash ganha 'computer use' nativo e promete agentes de IA mais autônomos

O Google DeepMind anunciou nesta terça-feira (24) a integração nativa do recurso "computer use" (uso de computador) ao modelo Gemini 3.5 Flash, marcando um avanço significativo para agentes de IA capazes de interagir com interfaces de computador de forma autônoma.

Anteriormente disponível apenas como um modelo independente (Gemini 2.5 computer use), a capacidade agora está incorporada diretamente ao Gemini 3.5 Flash — o que, segundo o Google, oferece o melhor desempenho já registrado em tarefas de uso de computador por agentes.

O que o Gemini 3.5 Flash consegue fazer

Com o computer use nativo, o modelo pode ver telas, navegar por interfaces, clicar, digitar e rolar páginas — essencialmente operando um computador como um humano faria. O Gemini já era capaz de realizar chamadas de função e usar ferramentas integradas como busca e mapas. Agora, com a capacidade de uso de computador, os desenvolvedores podem criar agentes personalizados que executam fluxos de trabalho completos em ambientes reais.

Alguns exemplos demonstrados:

  • Auditoria de acessibilidade: o modelo analisou a documentação do próprio Gemini App e retornou uma lista categorizada de funcionalidades
  • Revisão de documentação: o agente auditou a documentação do Gemini em busca de problemas de acessibilidade

Segurança em primeiro lugar

Para mitigar riscos de prompt injection em ambientes ativos, o Google implementou treinamento adversarial específico para computer use. A empresa também lançou dois sistemas opcionais de proteção para clientes enterprise:

  1. Confirmação explícita do usuário para ações sensíveis ou irreversíveis
  2. Parada automática de tarefas quando uma injeção indireta de prompt é detectada

A abordagem segue o princípio de "defesa em profundidade", combinando sandboxing seguro, verificação humana no circuito e controles de acesso rigorosos.

Clientes já estão usando

Empresas como Browserbase, Browser Use e UiPath já estão testando a tecnologia. Miguel Gonzalez Fernandez, da Browserbase, afirmou que a integração nativa elimina a complexidade de gerenciar um modelo separado para tarefas de uso de computador. Magnus Muller, CEO da Browser Use, destacou a latência reduzida e maior confiabilidade. Alvin Stanescu, diretor sênior da UiPath, apontou o potencial para automação empresarial de ponta a ponta.

Como começar

O recurso está disponível via Gemini API e Gemini Enterprise Agent Platform. Há também um ambiente de demonstração hospedado pela Browserbase em gemini.browserbase.com e uma implementação de referência open-source no GitHub.

Este lançamento posiciona o Google DeepMind na vanguarda dos agentes de IA autônomos — um mercado que está se tornando cada vez mais competitivo com o avanço de players como Anthropic (com o Computer Use do Claude) e OpenAI (com o Operator).

Leia também