ChatGPT 图像 2.0 怎么用?实测牛肉面菜单、杂志封面、多国语言科普效果

robot
摘要生成中

OpenAI 推出 ChatGPT Images 2.0 生图工具,主打强大的复杂排版与多语系文字(包含中文)处理能力。本文将全面介绍 Images 2.0 的功能、特色、免费与付费方案功能,以及实测生成结果。

ChatGPT Images 2.0 是什么?主要功能、特色告诉你!

来了能与 Gemini Nano Banana 2 一较高下的 AI 生图工具?OpenAI 宣布推出 ChatGPT Images 2.0,由全新的 GPT Image 2 模型驱动,主打“优秀的图像应具备选择、排列与揭示信息的能力”。下面是 ChatGPT Images 2.0 的 3 大特色:

强大的排版与多语系文字处理

首先,一个比较明显的特色是,ChatGPT Images 2.0 大幅提升了排版与多语系文字处理能力。

外媒《Techcrunch》指出,以前的 AI 图像生成工具多半采用扩散模型,在拼写文字方面经常遇到困难,而 ChatGPT Images 2.0 能精准呈现微小文字、图示与用户界面等细节。

OpenAI 表示,Images 2.0 在处理非拉丁字母的语言上有显著进步,包含中文、日文、韩文、印地文与孟加拉文等,都能以极高的清晰度生成并呈现在图像中。

图源:OpenAI ChatGPT Images 2.0 官方生成示例

全新的思考能力与联网搜索

除了排版与多语系文字处理能力外,ChatGPT Images 2.0 还提供全新的思考能力,可以通过即时搜索网络信息来辅助生成图像。该模型的知识库更新至 2025 年 12 月,有助于生成涉及近期事件的内容。

图源:OpenAI ChatGPT Images 2.0 官方生成示例

支持 2K 分辨率与多样化长宽比

ChatGPT Images 2.0 支持最高 2K 分辨率的图像生成,并提供更广泛的长宽比选择,从宽幅的 3:1 到长幅的 1:3 都包含在内。

OpenAI 研究负责人陈博远(Boyuan Chen)表示,Images 2.0 架构已经经过全面改版,属于一种通用模型。只需通过简单的文字提示,就能处理 3D 风格的视角转换与复杂的空间推理。

ChatGPT Images 2.0 免费、付费方案用户功能

一分钱一分货?ChatGPT Images 2.0 不同层级的付费用户,能解锁的功能也不同,整理如下:

  • 免费用户: 目前可以使用基础的 ImageGen 2.0 模型来执行标准的图像生成任务。基础版本已包含许多核心升级,例如更好的指令遵循能力、更强大的文字渲染效果、多语系支持以及更多元的长宽比选项。
  • ChatGPT Plus、Business 与 Enterprise 用户: 这些付费用户可以启用全新的思考模型。在该模式下,聊天机器人的图像生成器会运用网络搜索信息,基于用户上传的文件建立视觉解说图,并在实际生成图像前先进行结构推理。单次最多可同时生成 8 张图像,并能确保每个场景中的角色、物体与风格保持一致。
  • Pro 用户: 这些用户将获得更进阶的 ImageGen Pro 模型访问权限。虽然 OpenAI 尚未提供 Pro 与思考功能之间精确差异细节,但企业用户可以把思考功能视为实质性的功能升级,适用于需要基于事实、将内部文件转换为解说图,或是需要在多项资产中保持视觉一致性的任务。
  • API 开发人员: 现在可以整合 gpt-image-2 模型,并支持高解析度与灵活的长宽比设置。

ChatGPT Images 2.0 实测:菜单、杂志、解释图表等

ChatGPT Images 2.0 的实际表现,是否符合 OpenAI 的宣传?我们来实测一下。

实测牛肉面店菜单

《加密城市》编辑使用 ChatGPT 免费方案实测,制作一份台湾牛肉面料理菜单,提示词只简单说明:「帮我生成一张主打台湾牛肉面料理的菜单,菜单上面要使用繁体中文,呈现出每道菜的名称、价格、图像信息。」

以下是生成结果:

图源:ChatGPT Images 2.0 生成

就免费方案生成出来的内容而言,乍看起来还算不错,不过细看仍会发现:Images 2.0 在处理笔画较复杂的繁体中文字时,仍会出现书写错误的问题。也许付费方案的生成结果会更好。

另外,从生成结果来看,价格上也算是接近台北牛肉面价格,而且还可以内用免费加面一次。

不过,如果你的菜单要印刷出来,在印刷实务上,把 ChatGPT Images 2.0 提供的图档转换成向量档(如 EPS、Adobe Illustrator 的 .ai 档、PDF),并使用 CMYK 色调,是最适合印刷的。印刷厂虽然也可能接受 JPG 与 PNG 档案,但如果你对印刷成果有很高要求,就会更难调整成你想要的样子。

实测科技杂志封面

接下来实测科幻杂志封面。这次《加密城市》测试的是处理复杂排版的效果。提示词为:「帮我生成一张以繁体中文制作的科技杂志封面,杂志名称是「加密城市」,主题为「区块链与 AI 的交汇」。这个封面要有标题、卷号、条码上方的显示期限日期,所有文字都要呈现出清晰且专业的对齐效果。」

以下是生成结果:

图源:ChatGPT Images 2.0 生成

这个测试结果与上面的类似,都是乍看不错,但细看在处理复杂笔画的中文时仍有缺失。另外,封面字体与台湾字体商 Justfont 的「金萱体」很像,不知道是否取得了授权。

对于这样的疑惑,《加密城市》也曾在 Nano Banana Pro 推出时提出过。

  • 相关报道: Nano Banana Pro 实测:中文字有进步!但动画、字体侵权疑虑也浮现

实测多国语言解释性图表

《加密城市》测试了一张地震发生原因的繁体中文、日文、韩文图表,复杂多国语言文字大体渲染成功。在排版方面,则根据语言不同使用不同颜色来区分。虽然细看时仍有部分复杂笔画的中文、汉字或韩文出现模糊问题。

以下是生成结果:

图源:ChatGPT Images 2.0 生成

Images 2.0 可保持角色物体一致性,解决繁琐流程

另外,Images 2.0 也像 Nano Banana 2 一样具备可编辑性。只要点击生成图像左下方的「编辑」就能开始操作,可以保持角色与物体一致性,让生成漫画页面、社交媒体图文系列或房屋各房间的设计平面图变得更加容易。

ChatGPT Images 产品负责人 Adele Li 表示,这项功能解决了以往用户必须逐一生成单张图片并手动拼接的繁琐流程,让创作者可以轻松打造具备相同视觉基因的儿童绘本或品牌营销活动素材。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论