OpenAI が GPT-5.5 を公開:12M の文脈、AA 指数で首位獲得、Terminal-Bench 82.7% が代理のベンチマークを更新

OpenAI は 4/23 に正式に GPT-5.5 をリリースし、エージェント式(agentic)な業務と企業のナレッジ処理向けの主力モデルとして位置づけられており、同時に ChatGPT と Codex にも登場。公式の宣伝では「私たちが最も賢く、最も直感的に使えるモデル」と打ち出され、AA Intelligence Index は 60 点でトップに立ち、Claude Opus 4.7 と Gemini 3.1 Pro Preview にはそれぞれ 3 点差で先行している。

主要データ一覧

指標 GPT-5.5 対照(GPT-5.4 または同クラスの競合) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0(コマンドラインのワークフロー) 82.7% GPT-5.4:75.1% Expert-SWE(OpenAI 内部のプログラム評価) 73.1% GPT-5.4:68.5% コンテキストウィンドウ 1,200 万 tokens 大幅に向上。企業の全体のコードベース、または数時間の動画を処理可能 価格(100万 token あたり) 入力 5 ドル、出力 30 ドル GPT-5.4 の 2 倍の単価;ただし出力 token の使用量は約 40% 減少し、純コストは約 20% 上昇

位置づけ: 「Agent の時代」向けに設計

OpenAI は GPT-5.5 を、エージェント式演算の基礎モデルとして説明しており、複雑な目標を理解し、ツールを使用し、自己検査によって作業成果を確認でき、さらに人間が各ステップに介入することなく多段タスクを完了まで走らせられる。TechCrunch の取材によると、社長 Greg Brockman はこのバージョンを「未来の計算への大きな一歩だが、ただの一歩にすぎない」と表現し、またそれが「5.4 と比べてより速く、より鋭い推論者であり、使用する token もより少ない」と強調した。

チーフサイエンティスト Jakub Pachocki は「短期的に非常に顕著な改善が見えている」と述べ、研究責任者 Mark Chen は今回のバージョンが「科学と技術の研究ワークフローにおいて有意義なブレークスルーをもたらした」と強調した。

提供範囲とバージョンの階層化

GPT-5.5:Plus、Pro、Business、Enterprise のユーザーが ChatGPT と Codex で使用可能

GPT-5.5 Pro:Pro、Business、Enterprise のユーザーが ChatGPT で使用可能な、より上位の推論バージョン

Codex の統合:同時に OpenAI のプログラムエージェントツールで利用可能となり、多ファイル編集、コマンドライン、テストのループを強化

サイバーセキュリティと国防の論述が同時に引き上げられる

技術チームのメンバー Mia Glaese は TechCrunch の取材で、GPT-5.5 のサイバーセキュリティ能力が OpenAI における「モデルのデプロイにおいてデジタル防御へ投入する方法」に重大な影響を与えると述べた。この論調は、Anthropic が最近、Claude Mythos を武器級のサイバーセキュリティモデルとして巡って起きた論争と、直接対照的である――Altman は先ごろ『Core Memory』番組で、Anthropic の「恐怖のマーケティング」戦略を批判していた。OpenAI は GPT-5.5 で「攻守両面、デプロイ可能」という論調をさらに強調しており、Anthropic がアクセス制限を設ける立場との差を引き離す意図がある。

価格戦略の変化

GPT-5.5 は 100万 token あたりの価格を 2 倍にし、入力 5 ドル、出力 30 ドルへとした。これは GPT-5 シリーズで初めて、単価が大きく上昇する世代となる。OpenAI の説明はこうだ:モデルの推論効率により、出力 token の使用量が約 40% 減らせるため、典型的なタスクの実際の請求額は GPT-5.4 より約 20% 高いのであって、単純に 2 倍ではない。企業にとっては、そのための意思決定が「単価が割に合うかどうか」から、「同じ prompt のもとで、GPT-5.5 が token 総量をより少なくしてより複雑なタスクを完了できるか」に移る。

産業へのシグナル

GPT-5.5 は、Terminal-Bench と社内の SWE 評価における OpenAI の差を拡大させた。これらのベンチマークはそれぞれ、コマンドラインのエージェント実行と、実際のソフトウェアエンジニアリングのタスクをテストするものであり、Codex と Claude Code の正面対決においては、より直接的なスコア勝負の戦場となる。さらに、1,200 万 tokens のコンテキストウィンドウを同時に開放したことで、OpenAI は「企業ナレッジベースの全量処理」と「長時間タスクのエージェント」の 2 つのレースラインに同時に圧力をかける。Anthropic にとっては、AA 指数で 57 点の Claude Opus 4.7 が 3 点遅れていることに加え、Claude Code のユーザーにとっても、次世代(Opus 4.8 または新世代の Claude)の進捗を観察するもう 1 つの理由になる。

この記事は OpenAI が GPT-5.5 を推し進める:12M コンテキスト、AA 指数でトップ、Terminal-Bench 82.7% が代理基準を書き換えとして最初に掲載されました 鏈新聞 ABMedia で。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Ethereal Ventures主導でFere AIが$1.3Mの資金調達ラウンドを完了

Gate Newsメッセージ、4月24日――Fere AIは、AIを活用したデジタル資産トレーディング・エージェント・プラットフォームであり、Ethereal Ventures主導による$1.3 millionの資金調達ラウンドの完了を発表した。Galaxy Vision HillおよびKosmos Venturesが参加した。 このプラットフォームは、Ethereumを含むクロスチェーン・ネットワークに対応している。

GateNews10時間前

大手CEXウォレットがAIエージェント向けにAgentic Walletをゼロ手数料のプロモ期間付きでローンチ

Gate News メッセージ、4月24日 — 大手暗号資産取引所のウォレットが、AIエージェント向けの専用キーレスウォレットであるAgenticWalletをローンチしました。プラットフォームは、ユーザーがAIエージェントに対して、設定された範囲内で取引、送金、資産管理の各オペレーションを安全に実行することを許可できるようにします within configured

GateNews12時間前

Web3 AI インフラ AIW3、Buffalo Capital 主導で $2M のシード資金調達を実施

Gate News メッセージ、4月24日 — Web3 AI インフラ・プラットフォーム AIW3 は、$2 百万ドルのシードラウンド資金調達の完了を発表した。このラウンドは Buffalo Capital が主導し、GalaXin Capital と Three-stones Ventures が共同投資家として参加した。 AIW3 は、Agent-as-a-Service AaaS のオンチェーン実行パラダイムへ移行しており、呼び出し可能なストラテジー・サービス、自律型エージェントのオーケストレーション、ネイティブなバルト協調による資本フローを提供している。このプロジェクトは、次世代のシステムレベルのオンチェーン実行レイヤーを構築することを目指している。 同社は、コアとなるプロトコル・インフラストラクチャが正式に、完全に検証可能なリアルタイム運用段階へ移行したと述べており、スケーラブルな分散型エージェント・ネットワークとエコシステムの長期的な発展のための基盤を築いた。

GateNews14時間前

アラブ首長国連邦政府はAIエージェントの導入を発表し、最速で2028年までに業務の半数を自動化して運用すると発表した

アラブ首長国連邦は2年以内に、連邦政府の50%の部門・サービス・業務を自律AIエージェントで運用し、世界初の事例となることを発表した。AIは政府の実行パートナーとなり、意思決定を支援し、サービスを向上させ、自ら最適化する。すべての公務員は強制的に研修を受け、閣僚の業績とAI導入の成果が連動して評価され、これを大統領が監督し、専門チームが推進する。この取り組みは、10年以上の政策の積み重ねとAI戦略に由来し、その核心は人間中心である。

ChainNewsAbmedia15時間前

OristaPay、Telegram 上でAI搭載の決済システムを発表。TON で即時の USDT 決済を可能に

Gate News メッセージ、4月24日 — RD Technologiesの傘下で運営するブランドである OristaPay は、香港 Web3 フェスティバルにおいて、AI エージェントが Telegram のエコシステム内で取引を実行できる完全な決済経路を発表しました。このシステムでは、チャット画面を離れることなく、自然言語によるやり取りを通じてユーザーがデジタル資産の取引をトリガーできます。

GateNews17時間前
コメント
0/400
コメントなし