Voltar para o blog
Machine Learning

Google Photos revoluciona edição com re-composição 3D automática de fotos

22 de abril de 2026
14:28
IA generativaaprendizado de máquinavisão computacionaledição de fotosfotografiaGoogle Photosreconstrução 3Ddifusão latentetecnologia de imagem
Google Photos revoluciona edição com re-composição 3D automática de fotos

O desafio das fotos "quase perfeitas"

Quantas vezes você olhou para uma foto no seu celular e desejou ter capturado o momento de um ângulo diferente? Talvez um pouco mais da lateral do rosto, ou uma posição da câmera ligeiramente mais baixa para valorizar a cena. Ou ainda, um selfie com sorriso perfeito, mas com a distorção da lente grande-angular que altera a aparência natural.

Até agora, as edições tradicionais — como corte e zoom — ajudam, mas não solucionam o problema fundamental: a perspectiva da imagem permanece fixa e limitada ao que foi originalmente capturado. Zoomar não altera o paralaxe e recortar não revela o que ficou fora do enquadramento.

Imagem relacionada ao artigo de Google Research
Imagem de apoio da materia original.

Uma solução inovadora: re-composição 3D com IA generativa

Pesquisadores do Google anunciaram uma nova abordagem para editar a perspectiva de fotos após terem sido tiradas, já disponível na funcionalidade Auto frame do Google Photos. Essa tecnologia usa modelos de aprendizado de máquina para interpretar a foto como uma cena 3D, permitindo alterar automaticamente o posicionamento da câmera dentro desse espaço tridimensional.

Além de preservar o que estava visível originalmente, o sistema gera conteúdo adicional oculto na imagem original, criando uma nova perspectiva autêntica do momento congelado no tempo.

Imagem relacionada ao artigo de Google Research
Imagem de apoio da materia original.

Como funciona o método em duas etapas

  1. Estimativa da cena 3D e parâmetros da câmera: Um modelo interno estima um mapa 3D de pontos para cada pixel, reconstruindo a geometria da cena, com foco especial em corpos e rostos humanos para evitar distorções que prejudiquem a identidade. Simultaneamente, o sistema estima a distância focal e outros parâmetros da câmera original.
  2. Renderização e preenchimento generativo: A partir do mapa 3D, a imagem é re-renderizada com novos parâmetros de câmera, controlando posição, orientação e distância focal. Como o mapa 3D é incompleto, áreas ocultas aparecem como "buracos" na nova visão. Para preencher essas lacunas, um modelo generativo de difusão latente, treinado em pares de imagens com parâmetros conhecidos, produz conteúdo coerente e faz ajustes finais para garantir naturalidade e fidelidade.

Ajustes automáticos para retratos e correção de distorções

O sistema também usa modelos para detectar a posição e orientação 3D dos rostos principais na foto, calculando automaticamente os parâmetros ideais da câmera para melhorar o enquadramento, especialmente em retratos. Além disso, corrige distorções comuns de lentes grande-angulares frontais, ajustando os parâmetros virtuais da câmera para restaurar proporções naturais e favorecer a aparência do sujeito, como se a foto tivesse sido tirada de uma distância mais adequada.

Disponibilidade e integração no Google Photos

Essa tecnologia está implementada no recurso Auto frame do Google Photos, disponível para fotos que contenham pessoas. Os usuários podem acessar a imagem re-composicionada com o novo ângulo de câmera como uma opção adicional de edição, tornando o processo simples e automático, com apenas uma ação.

Por que essa pesquisa importa no mundo real

Ao permitir que usuários alterem o ponto de vista de fotos já tiradas, o Google oferece uma solução para o problema clássico das imagens "quase perfeitas" que não podem ser refeitas. A combinação de reconstrução 3D precisa com IA generativa possibilita uma edição que preserva a autenticidade, respeitando a identidade e o contexto da cena. Isso amplia as possibilidades criativas e práticas para fotógrafos amadores e profissionais, melhorando a qualidade das memórias digitais.

Links úteis