OpenAIは火曜日に正式にChatGPT Images 2.0を公開し、文字生成の正確度だけでなく、ポスターや人物画像におけるデザインの美しさも大幅に向上させました。このモデルはまた初めて「思考モード」を導入し、画像生成にネット検索や複数枚の一括出力の能力を持たせ、商用アプリケーションのシナリオに全面的に近づけています。

(CanvaがClaudeを深く統合すると発表し、AIの下書きをデザインの完成品へ変換する)

でたらめの創作から完璧なメニューへ：AIはついに「綴り」を覚えた

2年前を振り返ると、AIの画像生成モデルの文字生成における弱点はほぼ誰もが知っていました。プロンプトに文字の要件が含まれているだけで、出力結果には不条理な綴りミスやでたらめな創作がしばしば混ざり、英語以外の中国語・日本語・韓国語の言語ではさらに深刻でした。

公式発表の韓国語ポスターのイメージ図

いまや、ChatGPT Images 2.0は、事業者がそのまま利用できる宣伝用ポスターを1枚生成でき、文字は明確で正確です。研究者たちは近年、自身に自己回帰するモデル (Autoregressive Models) などの新しいアーキテクチャを積極的に探求しており、その動作ロジックや文字の理解、生成・検証能力が顕著に向上しています。

思考モードがオンライン：連網検索、構図の一貫性まですべて対応

ChatGPT Images 2.0の最も重要なアップグレードは「思考モード (Thinking Capabilities)」で、現在はChatGPT Plus、Pro、商用版、企業版の有料ユーザーに提供されています。これを有効にすると、モデルは画像生成を補助するためにリアルタイムでネット検索を行えるほか、ユーザーがアップロードしたファイルに基づいて対応する視覚的な説明図を作成し、正式な出力の前に画像内容を自己審査して最適化します。

大量生成の面では、思考モード下での単一プロンプトあたりの最大出力は一度に8枚の画像で、各画像の間で一貫したキャラクターの姿、物のスタイル、全体的なテイストを維持できるため、漫画の分割コマ、ソーシャルメディアの連載用の図と文章、さらには室内デザインの各空間の企画図にも適しています。

公式発表の漫画分割コマのイメージ図

解像度の面では、新モデルは最高2K出力に対応し、さらに3:1から1:3までの複数の縦横比オプションを追加して、さまざまな商用ニーズをより一層満たします。

アジア言語が大幅に最適化され、中日韓ユーザーに朗報！

英語以外に、OpenAIはImages 2.0がアジアの文字において重大な最適化を実施したと特別に指摘しており、日本語、韓国語、中国語などで明らかな改善が見られます。

数日前に中国のテクノロジー系コミュニティで拡散されたテスト記事も、この情報を裏づけており、複数の知乎のクリエイターが当時GPT-Image-2と競合のGoogle Nano Banana Proの実測比較を行いました。これには、中国語ポスターのデザイン、ECの表紙画像、ソーシャルメディアのインターフェース、データ化されたグラフなど、多様なシーンが含まれます。

知乎の記事のテスト：GPT-Image 2.0

テスト結果は、GPT-Image-2が中国語の文字の書体の美しさ、レイアウト階層、全体のデザイン感のいずれにおいても明確に優れていることを示しています。生成されたポスターのテイストは、明らかな「AI感」があるテンプレート式の出力ではなく、実際の商用素材により近いものになっています。記事では同時に、GPT-Image-2がインターフェースの再現、つまり「ゲーム画面やコミュニケーションアプリのスクリーンショット」(と真の人物のシーンの再現においても、より高いディテールの精度を示したと述べています。

ChatGPT Images 2.0が全面的に開放され、APIも同時に上線

現時点で、ChatGPT Images 2.0は今週火曜日からすべてのChatGPTおよびCodexユーザーに基礎機能を無料提供しています。有料ユーザーは、より高度な出力効果を解放できます。同時に、OpenAIもGPT-Image-2のAPIを開放しており、価格は出力品質と解像度に応じて段階的に計算され、企業側と開発者に統合の柔軟性を提供します。

注目すべき点として、新しいモデルの知識の締め切り日は2025年12月であり、最新の時事に関わる画像生成プロンプトでは、正確度に一定の制限がかかる可能性があります。さらに、複雑な構図の生成速度も、一般的な文字の質疑応答ほどは即時ではありませんが、それでも数分で済みます。

この記事：ChatGPT Images 2.0登場！文字生成の正確度が大幅に向上し、簡単に販促用ポスターを作成最初に登場したのは鏈新聞 ABMediaです。

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

モデル蒸留の非難と投資制限をめぐる中国・米国のAI対決

AI業界ニュース

ゲート・ニュース・メッセージ、4月24日――中国は、米国の巨大IT企業が産業規模の蒸留によって米国のAI技術を悪用しているという米国側の非難を退けた。両国は、AIの開発と投資の管理をめぐって大きな衝突に備えている。トランプ政権は、

GateNews1時間前

GoogleはAnthropicに最大$40 Billionを投資する計画。5+ギガワットの計算能力を約束

AI業界ニュース

Gate News メッセージ、4月24日 — 市場筋によると、GoogleはAnthropicに最大$40 billionを投資する計画だ。投資は、まず現金$10 billionから始まり、その後、指定されたマイルストーンの達成に応じてさらに最大$30 billionが追加される。 Googleはまた、提携の一環としてAnthropicに少なくとも5ギガワットの計算能力を提供する。

GateNews2時間前

スイス当局 FINMA、Anthropic の Mythos AI ツールが金融リスクをもたらすと警告

AI業界ニュース

ゲート・ニュース 4月24日 — スイスの金融市場監督当局 (FINMA) は、銀行が Anthropic の人工知能ツール Mythos を迅速かつ便利に導入できるようにすることは、重大なリスクをもたらすと述べた

GateNews3時間前

DeepSeek V4 は 1M コンテキストウィンドウで登場。Huawei Ascend と Cambricon チップは完全な互換性を実現

AI業界ニュース

ゲートニュース　4月24日 — DeepSeek V4-Pro と DeepSeek V4-Flash は 4月24日に正式にリリースされ、オープンソース化されました。コンテキスト処理長は 128K から 1M へ大幅に拡張され、ほぼ10倍の収容能力増を示しています。Huawei Computing は、その Ascend スーパーノード製品が

GateNews4時間前

Ethereal Ventures主導でFere AIが$1.3Mの資金調達ラウンドを完了

AIエージェント AI業界ニュース

Gate Newsメッセージ、4月24日――Fere AIは、AIを活用したデジタル資産トレーディング・エージェント・プラットフォームであり、Ethereal Ventures主導による$1.3 millionの資金調達ラウンドの完了を発表した。Galaxy Vision HillおよびKosmos Venturesが参加した。このプラットフォームは、Ethereumを含むクロスチェーン・ネットワークに対応している。

GateNews4時間前

Claude Code の変更をロールバック：品質低下の後、すべての修正は完了

AI業界ニュース

ゲートニュース（4月24日）— アンソトロピックは、Claude Code の品質が最近低下したことを認め、ロールバックと修正によって関連するすべての問題が解決されたことを確認しました。問題の原因は、4月上旬から中旬にかけて行われた3つのプロダクトおよびプロンプトの調整にありました。 3月4日、

GateNews6時間前

0/400

コメントなし