¡Llega ChatGPT Images 2.0! La precisión de generación de texto ha mejorado enormemente; crea fácilmente carteles de marketing

OpenAI 发布 ChatGPT Images 2.0 于周二正式上线,不仅大幅提升文本生成的准确度,以及海报与人像上的设计美感。该模型也首次引入“思考模式”,让图像生成具备网络搜索与多图批量输出能力,全面向商业应用场景靠拢。

(Canva 宣布深度整合 Claude,实现将 AI 草稿转化为设计成品)

从凭空捏造到完美菜单:AI 终于学会拼写

回顾两年前,AI 图像生成模型在文本生成的弱点几乎人尽皆知。只要提示词中包含文字需求,输出结果往往充斥荒谬的拼写错误,甚至是凭空捏造;在非英语的中日韩语言中更加严重。

官方公告的韩文海报示意图

如今,ChatGPT Images 2.0 已能生成一张可直接供运营方使用的宣传海报,文字清晰准确。研究人员近年积极探索自回归模型 (Autoregressive Models) 等新架构,其运作逻辑、对文字的理解、生成与验证能力显著提升。

思考模式上线:连网搜索、构图一致性统统到位

ChatGPT Images 2.0 最核心的升级在于“思考模式 (Thinking Capabilities)”。目前面向 ChatGPT Plus、Pro、商用版及企业版付费用户开放。启用后,模型可即时连网搜索信息以辅助图像生成;也能根据用户上传的文件制作对应的可视化说明图,并在正式输出前对图像内容进行自我审查与优化。

在批量生成方面,思考模式下单一提示词最多可一次输出八张图像,各图之间还能维持一致的角色形象、物件样式与整体风格,适合用于漫画分镜、社群媒体系列图文,乃至室内设计的各空间规划图。

官方公告的漫画分镜示意图

在分辨率方面,新模型支持最高 2K 输出,并新增从 3:1 到 1:3 的多种长宽比选项,进一步满足各类商业需求。

亚洲语言大幅优化,中日韩用户有福了!

除英文外,OpenAI 特别指出 Images 2.0 在亚洲文字上的重大优化,日文、韩文与中文等均有明显改善。

几天前在中国科技社群广泛流传的测试文章也验证了该消息,多位 知乎 创作者当时进行了 GPT-Image-2 与竞品 Google Nano Banana Pro 的实测比较,包括中文海报设计、电商封面图、社群媒体界面与数据化图表等多种场景。

知乎文章测试 GPT-Image 2.0

测试结果显示,GPT-Image-2 在中文字字体美感、排版层级与整体设计感上均明显胜出;生成的海报风格更接近真实商业素材,而非带有明显“AI 感”的模板式输出。文章同时指出,GPT-Image-2 在界面复刻 (如游戏画面或通讯软件截图) 以及真实人像场景的还原上,也展现出更高的细节精确度。

ChatGPT Images 2.0 全面开放,API 同步上线

目前,ChatGPT Images 2.0 已自本周二起向所有 ChatGPT 及 Codex 用户免费提供基础功能;付费用户则可解锁更进阶的输出效果。与此同时,OpenAI 也同步开放 GPT-Image-2 API。定价根据输出品质与分辨率分级计算,为企业端与开发者提供整合弹性。

值得注意的是,新模型的知识截止日期为 2025 年 12 月;对于涉及最新时事的图像生成提示词,准确度可能会受到一定限制。此外,复杂构图的生成速度也无法像一般文字问答那样即时,但仍仅需几分钟。

这篇文章 ChatGPT Images 2.0 登场!文字生成准确度大提升,轻松产出行销海报 最早出现于 鏈新聞 ABMedia。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

DeepSeek lanza una versión preliminar de código abierto V4, puntuación técnica 3206 superando a GPT-5.4

DeepSeek 推estamente lanzó oficialmente la serie de vista previa V4 el 24 de abril, con licencia MIT y código abierto, y los pesos del modelo ya se han publicado en Hugging Face y ModelScope. Según el informe técnico de DeepSeek V4, V4-Pro-Max (modo de máxima fuerza de inferencia) obtuvo 3206 puntos en el benchmark de Codeforces, superando a GPT-5.4.

MarketWhisperHace14m

Cambricon Completa la Adaptación del Día 0 de DeepSeek-V4, Marcando un Hito para el Ecosistema de Chips de IA de China

Mensaje de Gate News, 24 de abril — Cambricon anunció hoy que ha completado la adaptación del Día 0 de DeepSeek-V4, el último modelo de lenguaje grande de DeepSeek, utilizando su ecosistema propietario de software NeuWare y el framework vLLM. El código de adaptación se ha publicado simultáneamente como código abierto, marcando el

GateNewsHace31m

Tencent lanza en código abierto Hy3, versión preliminar; las pruebas de referencia del código mejoran un 40% con respecto a la generación anterior

Tencent el 23 de abril lanzó oficialmente como código abierto el modelo de lenguaje grande Hy3 en versión preliminar en las plataformas GitHub, Hugging Face y ModelScope, y también ofrece servicios de API de pago a través de Tencent Cloud. Según informó Decrypt el 24 de abril, la versión preliminar de Hy3 inició el entrenamiento a finales de enero y, para la fecha de publicación, habían transcurrido menos de tres meses.

MarketWhisperHace38m

Inversiones de cartera de FTX por valor de 158 billones de won si no hubiera quebrado

FTX, el exchange centralizado de criptomonedas que se acogió al Capítulo 11 de protección por bancarrota en noviembre de 2022 debido a la falta de liquidez y a la salida de capitales, habría mantenido inversiones valoradas en aproximadamente 158.796 billones de wones si no hubiera colapsado, según un análisis citado por Park

CryptoFrontierHace41m

Xiaomi Revela Detalles del Entrenamiento de MiMo-V2-Pro: Parámetros de Modelo 1T, Miles de GPUs Desplegadas

Mensaje de Gate News, 24 de abril: la jefa del equipo de modelos de lenguaje de Xiaomi, Luo Fuli, reveló en una entrevista en profundidad que el modelo MiMo-V2-Pro cuenta con un total de 1 billón de parámetros y que requirió miles de GPUs para el entrenamiento. Señaló que la escala de 1T representa el umbral mínimo para lograr

GateNewsHace55m

DeepSeek V4 logra una puntuación perfecta en Putnam-2025 y empata con Axiom en razonamiento matemático formal

Mensaje de Gate News, 24 de abril — DeepSeek V4 ha publicado resultados de evaluaciones de razonamiento matemático formal, logrando una puntuación perfecta de 120/120 en Putnam-2025, empatando con Axiom por el primer lugar. En el régimen práctico, usando LeanExplore y muestreo con restricciones, V4-Flash-Max obtuvo 81.00 en el

GateNewshace1h
Comentar
0/400
Sin comentarios