ChatGPT ganha novo editor de imagens DALL-E: saiba como funciona

A OpenAI lançou uma atualização significativa para o ChatGPT, introduzindo um novo e aprimorado editor de imagens. O recurso, que opera com base no modelo GPT Image 1.5, permite aos usuários editar imagens geradas pelo DALL-E diretamente na interface do chatbot, utilizando comandos de texto. A novidade busca aprimorar a experiência de personalização e agilizar o fluxo de trabalho criativo, permitindo modificações precisas sem a necessidade de gerar uma imagem completamente nova a cada ajuste.
Como o Novo Editor de Imagens do ChatGPT Funciona
O principal diferencial do novo editor de imagens do ChatGPT é a integração de ferramentas de edição seletiva com prompts de texto. Agora, ao gerar uma imagem com o DALL-E no ChatGPT, o usuário pode selecionar partes específicas da criação para aplicar modificações. O processo é simples: o usuário utiliza uma ferramenta de seleção (semelhante a um pincel) para delimitar a área da imagem que deseja alterar e, em seguida, insere um comando de texto descrevendo a mudança desejada. A inteligência artificial então processa o comando, alterando apenas a área selecionada, mantendo o restante da composição original intacto.
Essa funcionalidade permite diversas aplicações, como adicionar um novo elemento a uma cena, remover objetos indesejados, alterar a cor de um item específico ou mudar o estilo de uma parte da imagem. Por exemplo, é possível solicitar que a IA adicione um chapéu a uma pessoa na imagem ou mude a cor de um carro de azul para vermelho. O recurso representa um avanço considerável em relação às versões anteriores, onde os usuários precisavam reescrever o prompt inteiro para tentar obter pequenas alterações, muitas vezes resultando em uma imagem completamente diferente da original.
Veja também:
Melhorias de Desempenho e Consistência
A atualização do editor de imagens do ChatGPT não se limita apenas à funcionalidade de edição seletiva. A OpenAI também implementou melhorias técnicas no modelo subjacente (GPT Image 1.5), visando otimizar a velocidade e a qualidade das criações. De acordo com a empresa, o novo modelo é capaz de gerar imagens até quatro vezes mais rápido do que a versão anterior. Além disso, a precisão das edições foi aprimorada, garantindo maior consistência visual.
Uma das principais dificuldades de modelos de IA generativa anteriores era manter a coerência visual ao fazer edições. O novo modelo GPT Image 1.5 se destaca por preservar detalhes cruciais, como iluminação, enquadramento e a aparência de pessoas ou objetos, mesmo após múltiplas modificações. Isso garante que as edições se integrem de forma mais natural à imagem original. Outro avanço notável é a melhoria na renderização de texto dentro das imagens, permitindo que o modelo gere textos mais nítidos e legíveis, inclusive em tamanhos menores.
Disponibilidade e Contexto Competitivo
O novo editor de imagens do ChatGPT está sendo implementado gradualmente para os usuários das versões pagas da plataforma, incluindo os planos Plus, Team e Enterprise. A OpenAI também disponibilizou o modelo GPT Image 1.5 para desenvolvedores através de sua API, permitindo que terceiros integrem o recurso em seus próprios aplicativos e serviços.
O lançamento ocorre em um cenário de intensa competição no mercado de inteligência artificial generativa. Com a introdução deste editor de imagens, a OpenAI busca consolidar o ChatGPT como uma plataforma “tudo-em-um”, capaz de oferecer tanto um assistente de texto quanto um estúdio de criação visual. A movimentação é vista como uma resposta direta ao avanço de concorrentes como o NanoBanana Pro, do Google, que também oferece recursos avançados de edição de imagens baseados em IA.
Novos Recursos de Geração e Descoberta
Além do editor de imagens, a atualização inclui uma seção dedicada à geração de imagens dentro do ChatGPT. Nesta área, os usuários podem explorar sugestões de prompts predefinidos e diferentes estilos artísticos, facilitando a criação de artes personalizadas. A OpenAI afirma que o objetivo é tornar a criação de imagens mais acessível e intuitiva, permitindo que os usuários experimentem diferentes estilos visuais com mais facilidade. A empresa acredita que aprimoramentos como este são passos significativos no desenvolvimento da geração de imagens por IA, com potencial para aplicações em marketing, e-commerce e design.
