Imagens do ChatGPT 2.0 chegaram! A precisão na geração de texto melhora significativamente, permitindo criar facilmente cartazes de marketing

A OpenAI anunciou oficialmente na terça-feira a chegada do ChatGPT Images 2.0, não só melhorando substancialmente a precisão na geração de texto, como também a estética de design em cartazes e retratos. O modelo introduz também pela primeira vez um “modo de pensamento”, que permite que a geração de imagens tenha capacidades de pesquisa na web e de saída em lote de várias imagens, aproximando-se de forma abrangente de cenários de aplicação comerciais.

(A Canva anuncia integração profunda com o Claude, permitindo transformar rascunhos de IA em peças de design prontas)

Do nada até um menu perfeito: a IA finalmente aprendeu a soletrar

Ao recordar há dois anos, os pontos fracos dos modelos de geração de imagens por IA na geração de texto são praticamente do conhecimento geral. Desde que o pedido inclua necessidades de texto, o resultado costuma estar cheio de erros de ortografia absurdos e até de invenções. Isto é ainda mais grave em línguas como o japonês, coreano e chinês, que não são inglês.

Imagem ilustrativa do cartaz oficial em coreano

Agora, o ChatGPT Images 2.0 já consegue gerar um cartaz de divulgação que pode ser usado diretamente pelos operadores, com texto nítido e preciso. Nos últimos anos, os investigadores têm explorado activamente novas arquiteturas como modelos de auto-retroalimentação (Autoregressive Models), e a lógica de funcionamento, a compreensão do texto, as capacidades de geração e de verificação melhoraram de forma significativa.

Modo de pensamento em funcionamento: pesquisa online e consistência na composição, tudo bem resolvido

A actualização mais central do ChatGPT Images 2.0 está no “modo de pensamento (Thinking Capabilities)”, que actualmente está disponível para utilizadores pagantes do ChatGPT Plus, Pro, da versão comercial e da versão empresarial. Após activação, o modelo consegue pesquisar informações na web em tempo real para auxiliar a geração de imagens; também consegue criar descrições visuais correspondentes a partir dos ficheiros enviados pelo utilizador e, antes da saída final, realiza uma auto-revisão e optimização do conteúdo das imagens.

Na geração em lote, no modo de pensamento, com um único pedido é possível produzir até oito imagens de uma só vez, e entre as imagens consegue manter consistentemente as características do personagem, o estilo dos objectos e o estilo global. Isto é adequado para painéis de histórias em quadrinhos, séries de imagens e texto em redes sociais, e até para diagramas de planeamento de espaços em design de interiores de vários ambientes.

Imagem ilustrativa dos painéis de histórias em quadrinhos do anúncio oficial

Em termos de resolução, o novo modelo suporta uma saída máxima de 2K e adiciona várias opções de proporção de aspecto de 3:1 a 1:3, satisfazendo ainda melhor diversas necessidades comerciais.

Línguas asiáticas optimizadas de forma significativa: utilizadores de japonês, chinês e coreano, têm sorte!

Além do inglês, a OpenAI destacou especialmente grandes optimizações do Images 2.0 para textos asiáticos: japonês, coreano e chinês, entre outras, mostram melhorias evidentes.

Um artigo de testes divulgado há alguns dias em comunidades tecnológicas chinesas também confirmou esta notícia. Vários criadores no Zhihu realizaram na altura comparações de testes práticos entre GPT-Image-2 e o concorrente Google Nano Banana Pro, incluindo múltiplos cenários como design de cartazes em chinês, imagens de capas para e-commerce, interfaces de redes sociais e gráficos e tabelas de dados.

Teste do artigo do Zhihu ao GPT-Image 2.0

Os resultados dos testes mostram que o GPT-Image-2 supera claramente o concorrente em beleza da tipografia chinesa, níveis de paginação e sensação geral de design. Os cartazes gerados têm um estilo mais próximo de materiais comerciais reais, em vez de uma saída do tipo “modelo” com um “toque de IA” claramente perceptível. O artigo também aponta que o GPT-Image-2, na reprodução de (como cenas de jogos ou capturas de ecrã de software de comunicação) e na fidelidade de cenários com retratos reais, demonstra também uma maior precisão de detalhes.

ChatGPT Images 2.0 totalmente disponibilizado, API em sincronização

Neste momento, o ChatGPT Images 2.0 já está, desde esta terça-feira, a ser disponibilizado gratuitamente a todos os utilizadores do ChatGPT e do Codex para funcionalidades base. Os utilizadores pagantes podem desbloquear efeitos de saída mais avançados. Ao mesmo tempo, a OpenAI disponibiliza também a API do GPT-Image-2. Os preços são calculados por escalões consoante a qualidade de saída e a resolução, oferecendo flexibilidade de integração para empresas e programadores.

Importa notar que a data-limite de conhecimento do novo modelo é dezembro de 2025. Para pedidos de geração de imagens que envolvam acontecimentos noticiosos recentes, a precisão pode ser limitada até certo ponto. Além disso, a velocidade de geração de composições complexas também não consegue ser tão imediata como uma conversa normal com perguntas e respostas de texto, mas ainda assim bastam apenas alguns minutos.

Este artigo “ChatGPT Images 2.0 em destaque! A precisão da geração de texto melhora bastante, produz com facilidade cartazes de marketing” surge primeiro em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Admiral Indica que o Governo dos EUA Opera um Nó de Bitcoin sem Mineração

Um almirante sénior indicou que o Governo dos EUA está a operar activamente um nó na rede Bitcoin, enquanto evita deliberadamente participar em actividades de mineração. A divulgação sugere que as autoridades estão a assumir um papel mais envolvido na infra-estrutura de blockchain para supervisão e

CryptoFrontier14m atrás

Receita do 1.º trimestre da Tesla aumenta 16% para 22,4 mil milhões de dólares; robô humanoide com estreia prevista para meados de 2026

Mensagem das Gate News, 24 de Abril — A Tesla reportou uma receita do primeiro trimestre de 22,4 mil milhões de US$ em 23 de Abril, representando um aumento de 16% em termos homólogos. As entregas globais de veículos da empresa ultrapassaram as 358.000 unidades, enquanto a produção superou as 408.000 unidades. A Gigafábrica de Xangai da Tesla entregou 213.000 veícu

GateNews14m atrás

Lucro da SK Hynix no 1.º trimestre dispara cinco vezes para um recorde com a euforia da IA, aumentando os bónus dos colaboradores para $878K

Mensagem de notícias da Gate, 24 de abril — A SK Hynix reportou uma subida de cinco vezes no lucro operacional trimestral, para um recorde de 37,61 biliões de won ($32,4 mil milhões) a 23 de abril, impulsionada pela procura acelerada de inteligência artificial e centros de dados. O excedente está a financiar bónus para colaboradores sem precedentes, que os analistas prevêem poderem atingir até $878.000 por trabalhador em 2027, se as actuais previsões de resultados se mantiverem.

GateNews55m atrás

Arquitectura do DeepSeek V4 Verificada: 3 de 4 Previsões Acertadas, Módulo Engram Ausente

Mensagem de notícias da Gate, 24 de Abril — A DeepSeek lançou hoje o modelo V4, validando previsões arquitectónicas anteriores feitas através da análise da biblioteca de kernels TileKernels lançada ontem (23 de Abril). De acordo com o acompanhamento da Beating, três componentes centrais foram confirmados: mHC

GateNews55m atrás

A DeepSeek Lança a Série de Modelos Open-Source V4 com 1,6T Parâmetros e Licença MIT

Mensagem do Gate News, 24 de abril — A DeepSeek lançou a série V4 de modelos de código aberto sob a Licença MIT, com pesos agora disponíveis na Hugging Face e na ModelScope. A série inclui dois modelos (MoE) de mixture-of-experts: V4-Pro com 1,6 biliões de parâmetros totais e 49 mil milhões ativados por token

GateNews1h atrás

A SoftBank Planeia uma Fábrica de Baterias para Centros de Dados de IA em Osaka, com Objectivo de Produção em Cinco Anos

Mensagem da Gate News, 24 de Abril — A SoftBank Corp, a unidade móvel do grupo SoftBank do Japão, planeia converter parte da sua fábrica em Sakai, Osaka, numa grande linha de produção de baterias para centros de dados de IA. O CEO Junichi Miyakawa deverá anunciar o projecto em Maio, no âmbito de um novo plano de cinco anos,

GateNews1h atrás
Comentar
0/400
Nenhum comentário