Google DeepMind apresenta Gemini Omni e Gemini 3.5 com 11 demonstrações inovadoras em vídeo

Novos modelos Gemini Omni e Gemini 3.5 trazem avanços significativos em IA multimodal e agentes inteligentes

Na conferência Google I/O 2026, a Google DeepMind revelou seus mais recentes modelos de inteligência artificial: Gemini Omni e a família Gemini 3.5. Ambos representam avanços expressivos no campo da IA generativa e agentes inteligentes, com aplicações práticas em criação de conteúdo, automação e suporte a fluxos de trabalho complexos.

Gemini Omni: edição de vídeos por linguagem natural e multimodalidade

O Gemini Omni é um modelo multimodal avançado que permite criar e editar vídeos a partir de qualquer combinação de imagens, áudio, texto e vídeo. Uma das funcionalidades mais notáveis é a capacidade de editar vídeos apenas por meio de comandos em linguagem natural, mantendo a consistência dos personagens, a física da cena e a continuidade do conteúdo.

Exemplos demonstrados incluem transformar um objeto da cena em uma escultura feita de bolhas, alterar a iluminação do ambiente ou criar efeitos visuais complexos, como uma esfera de vidro com uma representação recursiva infinita do ambiente ao redor. O modelo permite refinar vídeos em múltiplas etapas, ajustando ângulos, estilos e detalhes sem perder o contexto original.

Gemini 3.5 Flash: inteligência para tarefas complexas e agentes autônomos

A família Gemini 3.5, especialmente o 3.5 Flash, é focada em executar tarefas de múltiplas etapas com alta velocidade e precisão. Utilizando o motor Antigravity, o modelo pode gerenciar fluxos de trabalho complexos, como renomear e categorizar grandes volumes de dados não estruturados, além de criar interfaces visuais interativas e gráficos dinâmicos.

O 3.5 Flash também suporta a geração paralela de múltiplos conceitos criativos, exemplificado pela criação rápida de 64 variações fractais. Outra aplicação prática é a aceleração de desenvolvimento de interfaces de usuário, como diferentes versões para um fluxo de checkout, geradas em apenas 60 segundos na plataforma AI Studio.

Integração com produtos Google e experiência do usuário

O Gemini 3.5 Flash é o modelo padrão para o aplicativo Gemini e o modo AI na Pesquisa Google em todo o mundo. Seus recursos de agente inteligente estão sendo usados para criar novos recursos, como agentes de informação que monitoram atualizações personalizadas, enviando resumos detalhados com links para aprofundamento. Inicialmente, esses agentes estarão disponíveis para assinantes Google AI Pro e Ultra ainda no verão norte-americano de 2026.

Além disso, o Gemini Spark é um agente pessoal que opera 24/7, integrado com ferramentas do Google Workspace (Gmail, Docs, Slides etc.), auxiliando o usuário em tarefas cotidianas sob sua direção. O lançamento em beta está previsto para assinantes Google AI Ultra nos EUA.

Disponibilidade e acesso aos modelos

Gemini Omni Flash está disponível para assinantes Google AI Plus, Pro e Ultra globalmente via aplicativo Gemini e Google Flow, além de estar acessível gratuitamente para usuários dos apps YouTube Shorts e YouTube Create.
Nas próximas semanas, a Google planeja liberar APIs para desenvolvedores e clientes corporativos.
Gemini 3.5 Flash pode ser acessado via Google Antigravity, API Gemini no AI Studio e Android Studio, plataforma Gemini Enterprise Agent e Gemini Enterprise.
Ambos os modelos já estão integrados ao modo AI na Pesquisa Google, com recursos visuais e interativos sendo disponibilizados gratuitamente para todos os usuários ainda neste verão.