Google Photos revoluciona edição com re-composição 3D automática de fotos

O desafio das fotos "quase perfeitas"

Quantas vezes você olhou para uma foto no seu celular e desejou ter capturado o momento de um ângulo diferente? Talvez um pouco mais da lateral do rosto, ou uma posição da câmera ligeiramente mais baixa para valorizar a cena. Ou ainda, um selfie com sorriso perfeito, mas com a distorção da lente grande-angular que altera a aparência natural.

Até agora, as edições tradicionais — como corte e zoom — ajudam, mas não solucionam o problema fundamental: a perspectiva da imagem permanece fixa e limitada ao que foi originalmente capturado. Zoomar não altera o paralaxe e recortar não revela o que ficou fora do enquadramento.

Imagem relacionada ao artigo de Google Research — Imagem de apoio da materia original.

Uma solução inovadora: re-composição 3D com IA generativa

Pesquisadores do Google anunciaram uma nova abordagem para editar a perspectiva de fotos após terem sido tiradas, já disponível na funcionalidade Auto frame do Google Photos. Essa tecnologia usa modelos de aprendizado de máquina para interpretar a foto como uma cena 3D, permitindo alterar automaticamente o posicionamento da câmera dentro desse espaço tridimensional.

Além de preservar o que estava visível originalmente, o sistema gera conteúdo adicional oculto na imagem original, criando uma nova perspectiva autêntica do momento congelado no tempo.

Como funciona o método em duas etapas

Estimativa da cena 3D e parâmetros da câmera: Um modelo interno estima um mapa 3D de pontos para cada pixel, reconstruindo a geometria da cena, com foco especial em corpos e rostos humanos para evitar distorções que prejudiquem a identidade. Simultaneamente, o sistema estima a distância focal e outros parâmetros da câmera original.
Renderização e preenchimento generativo: A partir do mapa 3D, a imagem é re-renderizada com novos parâmetros de câmera, controlando posição, orientação e distância focal. Como o mapa 3D é incompleto, áreas ocultas aparecem como "buracos" na nova visão. Para preencher essas lacunas, um modelo generativo de difusão latente, treinado em pares de imagens com parâmetros conhecidos, produz conteúdo coerente e faz ajustes finais para garantir naturalidade e fidelidade.

Ajustes automáticos para retratos e correção de distorções

O sistema também usa modelos para detectar a posição e orientação 3D dos rostos principais na foto, calculando automaticamente os parâmetros ideais da câmera para melhorar o enquadramento, especialmente em retratos. Além disso, corrige distorções comuns de lentes grande-angulares frontais, ajustando os parâmetros virtuais da câmera para restaurar proporções naturais e favorecer a aparência do sujeito, como se a foto tivesse sido tirada de uma distância mais adequada.

Disponibilidade e integração no Google Photos

Essa tecnologia está implementada no recurso Auto frame do Google Photos, disponível para fotos que contenham pessoas. Os usuários podem acessar a imagem re-composicionada com o novo ângulo de câmera como uma opção adicional de edição, tornando o processo simples e automático, com apenas uma ação.

Por que essa pesquisa importa no mundo real

Ao permitir que usuários alterem o ponto de vista de fotos já tiradas, o Google oferece uma solução para o problema clássico das imagens "quase perfeitas" que não podem ser refeitas. A combinação de reconstrução 3D precisa com IA generativa possibilita uma edição que preserva a autenticidade, respeitando a identidade e o contexto da cena. Isso amplia as possibilidades criativas e práticas para fotógrafos amadores e profissionais, melhorando a qualidade das memórias digitais.