OpenAI lança ChatGPT Images 2.0: geração de imagens com texto surpreendentemente preciso

Apresentação do ChatGPT Images 2.0
A OpenAI lançou recentemente o ChatGPT Images 2.0, a nova versão do seu modelo de geração de imagens que demonstra avanços significativos na qualidade e na capacidade de gerar textos dentro das imagens, algo historicamente desafiador para inteligências artificiais.
O que há de novo no Images 2.0?
Enquanto modelos anteriores, como o DALL-E 3, apresentavam dificuldades para produzir textos legíveis e coerentes em imagens — resultando em palavras inventadas ou erros de ortografia — o Images 2.0 consegue criar imagens com menus, textos e elementos visuais que parecem feitos por humanos, com grafia correta e detalhamento refinado.

Um exemplo citado foi a geração de um menu mexicano com nomes e preços plausíveis, sem as bizarrices que modelos anteriores costumavam criar, como "enchuita" ou "churiros".
Capacidades técnicas e diferenciais
- O modelo conta com "capacidades de raciocínio", permitindo buscar informações na web, gerar múltiplas imagens a partir de um único comando e revisar suas próprias criações para garantir maior fidelidade.
- Suporta melhor renderização de textos em idiomas com alfabetos não latinos, como japonês, coreano, hindi e bengali.
- Consegue criar ativos de marketing em vários tamanhos e até tiras de quadrinhos com múltiplos painéis.
- Oferece resolução de até 2K, preservando detalhes finos, como ícones, elementos de interface e composições densas.
Apesar da melhora na qualidade, a geração de imagens complexas pode levar alguns minutos, diferentemente da resposta instantânea de texto do ChatGPT.
Disponibilidade e acesso
O ChatGPT Images 2.0 já está disponível para todos os usuários do ChatGPT e Codex a partir da terça-feira após o lançamento. Usuários pagos terão acesso a recursos avançados, com maior capacidade de geração e qualidade.
Além disso, a OpenAI disponibilizou uma API específica para o modelo, chamada gpt-image-2, cujo preço varia conforme a qualidade e a resolução das imagens produzidas. Informações detalhadas sobre preços podem ser encontradas na página oficial da OpenAI: https://openai.com/api/pricing/.
Impacto prático para usuários e empresas
Com o avanço do Images 2.0, designers, profissionais de marketing e criadores de conteúdo ganham uma ferramenta poderosa para gerar imagens com textos complexos e específicos, reduzindo o tempo e o custo da produção gráfica.
A melhoria na fidelidade de textos e detalhes visuais amplia o uso para aplicações comerciais, como criação de menus, materiais promocionais, quadrinhos e outros formatos visuais que antes demandavam ajustes manuais frequentes após a geração automática.