DeepSeek は V4 のオープンソース・プレビュー版を提供し、技術スコア 3206 で GPT-5.4 を上回った

DeepSeek V4開源預覽版

DeepSeek は 4 月 24 日に V4 プレビュー版シリーズを正式にリリースし、MIT ライセンスでオープンソース化されています。モデルの重みは Hugging Face と ModelScope に同時に反映されています。DeepSeek V4 技術レポートによれば、V4-Pro-Max(最高推論強度モード)は Codeforces のベンチマークで 3206 点を獲得し、GPT-5.4 を上回りました。

2 種類の MoE モデルアーキテクチャ仕様

DeepSeek V4 技術レポートによれば、V4 シリーズには 2 つの混合専門家(MoE)モデルが含まれます:

V4-Pro:総パラメータ 1.6T、1 トークン当たりのアクティベーション 49B、1M トークンのコンテキストに対応

V4-Flash:総パラメータ 284B、1 トークン当たりのアクティベーション 13B、同様に 1M トークンのコンテキストに対応

技術レポートによると、1M コンテキスト下における V4-Pro の単一トークン推論 FLOPs は V3.2 の 27% に過ぎず、KV キャッシュは V3.2 の 10% にまで低下しています。主な要因は、混合注意機構(圧縮稀薄注意 CSA + 高度圧縮注意 HCA)によるアーキテクチャのアップグレードです。事前学習データ規模は 32T トークン超;学習最適化器の更新は Muon です。

後訓練の方法論:オンライン戦略蒸留が混合強化学習に取って代わる

DeepSeek V4 技術レポートによれば、V4 の後訓練における中核の更新は、オンライン戦略蒸留(On-Policy Distillation,OPD)によって V3.2 の混合強化学習(mixed RL)フェーズを完全に置き換えることにあります。新しいプロセスは 2 段階に分かれます。まず数学、コード、Agent、および命令追従などの領域ごとに領域専門家をそれぞれ訓練します(SFT + GRPO 強化学習)。その後、多教師 OPD により、十数人の専門家の能力を単一モデルへ蒸留し、logit の整合により従来手法でよく見られる能力の競合を回避します。

レポートは同時に生成的報酬モデル(Generative Reward Model,GRM)も導入しており、ルールで検証しにくいタスクに対して、少量の多様な人工ラベル付きデータで訓練することで、モデルが生成と評価の双方を担えるようにします。

ベンチマーク成績:コーディングで先行、知識推論にはギャップ

DeepSeek V4 技術レポートによれば、V4-Pro-Max と Opus 4.6 Max、GPT-5.4 xHigh、Gemini 3.1 Pro High の比較結果(直近でリリースされた GPT-5.5 および Opus 4.7 は含まず):

Codeforces:3206(GPT-5.4:3168 / Gemini 3.1 Pro:3052)→ 会場最高

LiveCodeBench:93.5 → 会場最高

SWE Verified:80.6、Opus 4.6 の 80.8 に遅れ 0.2 パーセントポイント

GPQA Diamond:90.1、Gemini 3.1 Pro の 94.3 に遅れ

SimpleQA-Verified:57.9、Gemini 3.1 Pro の 75.6 に遅れ

HLE:37.7、Gemini 3.1 Pro の 44.4 に遅れ

技術レポートはまた、上記の比較には最近リリースされた GPT-5.5 と Opus 4.7 が含まれておらず、V4 と最新世代のクローズドモデルとのギャップは第三者によるベンチマーク評価で検証が必要だと指摘しています。

よくある質問

DeepSeek V4 プレビュー版のオープンソースライセンス条項は何ですか。どこで取得できますか?

DeepSeek の 4 月 24 日の公式発表によると、V4 シリーズは MIT ライセンスでオープンソース化されており、モデルの重みは Hugging Face と ModelScope に公開されています。商業および学術用途に適用されます。

DeepSeek V4-Pro と V4-Flash のパラメータ規模の違いは何ですか?

DeepSeek V4 技術レポートによると、V4-Pro の総パラメータは 1.6T、1 トークン当たりのアクティベーションは 49B です;V4-Flash の総パラメータは 284B、1 トークン当たりのアクティベーションは 13B で、いずれも 1M トークンのコンテキストに対応しています。

DeepSeek V4-Pro-Max と GPT-5.4 および Gemini 3.1 Pro のベンチマーク比較結果は何ですか?

DeepSeek V4 技術レポートによると、V4-Pro-Max は Codeforces(3206 点)と LiveCodeBench(93.5)の 2 つのベンチマークで GPT-5.4 と Gemini 3.1 Pro を上回りましたが、知識集約型ベンチマーク(GPQA Diamond、SimpleQA-Verified、HLE)では依然として Gemini 3.1 Pro に遅れています。比較対象のセットには GPT-5.5 と Opus 4.7 は含まれていません。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

NeoSoul共同創業者Kaelan:AI業界はおもちゃの存在を認めるべき。イノベーションはしばしば実験的な製品として始まる

Gate Newsメッセージ、4月24日――最近の香港での「インテリジェントな暗号化ファイナンス」に関するフォーラムで、NeoSoulの共同創業者Kaelanが、急速に進化するAI業界における初期段階でのAIプロジェクトの評価方法について見解を共有した。現在の製品を評価することに加えて、チームは基盤となるモデルの能力に合わせて追随できることを示さなければならないと、彼は述べた。「

GateNews24分前

メタとアマゾン、AI開発向けにGravitonチップを供給する数十億ドル規模の取引で合意

Gate Newsメッセージ、4月24日—メタ・プラットフォームズとアマゾン・ウェブ・サービス(AWS)は、ウォール・ストリート・ジャーナルによれば、今後数年間にわたってメタの人工知能(AI)イニシアチブを支援するための数十億ドル規模の契約に到達した。契約の下で、メタはAIエージェントおよびその他のAIプロジェクトに電力を供給するために、数千万台規模のAWS Gravitonチップ・コアを使用する

GateNews36分前

DeepSeek V4-Flash が Ollama Cloud に登場、米国ホスト:Claude Code、OpenClaw をワンクリックで接続

Ollama Cloud は DeepSeek V4-Flash を出品し、推論は米国ホストで行い、3組のワンクリック指示で Claude Code、OpenClaw、Hermes に接続できるようにしています。V4-Flash/V4-Pro は MoE アーキテクチャを採用し、1M のコンテキストをネイティブにサポートし、Token-wise 圧縮+DSA の疎な注意によりコストを削減します。1M のシーンでは、1トークンあたりの FLOPs が 27% 低下し、KV キャッシュが 10% 低下します。API は OpenAI ChatCompletions および Anthropic と互換で、複数のワークフロー間の切り替えが容易になり、コストとデータ主権リスクを低減します。

ChainNewsAbmedia2時間前

Web3 AI インフラ AIW3、Buffalo Capital 主導で $2M のシード資金調達を実施

Gate News メッセージ、4月24日 — Web3 AI インフラ・プラットフォーム AIW3 は、$2 百万ドルのシードラウンド資金調達の完了を発表した。このラウンドは Buffalo Capital が主導し、GalaXin Capital と Three-stones Ventures が共同投資家として参加した。 AIW3 は、Agent-as-a-Service AaaS のオンチェーン実行パラダイムへ移行しており、呼び出し可能なストラテジー・サービス、自律型エージェントのオーケストレーション、ネイティブなバルト協調による資本フローを提供している。このプロジェクトは、次世代のシステムレベルのオンチェーン実行レイヤーを構築することを目指している。 同社は、コアとなるプロトコル・インフラストラクチャが正式に、完全に検証可能なリアルタイム運用段階へ移行したと述べており、スケーラブルな分散型エージェント・ネットワークとエコシステムの長期的な発展のための基盤を築いた。

GateNews2時間前

CohereがドイツのAI企業Aleph Alphaを買収、欧州展開に向けて$600M 投資を確保

Gate Newsメッセージ、4月24日—カナダのAI企業Cohereは、欧州での存在感を強化するため、ドイツのAI企業Aleph Alphaを買収する計画を発表した。Aleph Alphaの支援者であるSchwarz Groupは、CohereのSeries Eの資金調達ラウンドで$600 百万ドルを投資する予定だ。 この資金調達ラウンドは202でクローズする見込み

GateNews3時間前

XpengとXiaomiが北京モーターショーで車載AI推進をリード

ゲートニュース、4月24日——中国の自動車メーカーは、4月24日の北京モーターショーで先進的な車載AIシステムを披露した。同国はAI Plus戦略を加速し、海外の半導体への依存度を高めることを目指している。 Xpengは、運転者が手動で場所を選択する代わりに、話しかけて指示できる音声制御の駐車を披露した、

GateNews3時間前
コメント
0/400
コメントなし