
DeepSeek 于 4 月 24 日正式推出 V4 预览版系列,以 MIT 许可协议开源,模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告,V4-Pro-Max(最高推理力度模式)在 Codeforces 基准取得 3206 分,超越 GPT-5.4。
两款 MoE 模型架构规格
根据 DeepSeek V4 技术报告,V4 系列包含两款混合专家(MoE)模型:
V4-Pro:总参数 1.6T,每 token 激活 49B,支持 1M token 上下文
V4-Flash:总参数 284B,每 token 激活 13B,同样支持 1M token 上下文
根据技术报告,V4-Pro 在 1M 上下文下的单 token 推理 FLOPs 仅为 V3.2 的 27%,KV 缓存降至 V3.2 的 10%,主要得益于混合注意力机制(压缩稀疏注意力 CSA + 重度压缩注意力 HCA)的架构升级。预训练数据规模超过 32T token;训练优化器更新为 Muon。
后训练方法论:在线策略蒸馏取代混合强化学习
根据 DeepSeek V4 技术报告,V4 后训练的核心更新在于以在线策略蒸馏(On-Policy Distillation,OPD)完全取代 V3.2 的混合强化学习(mixed RL)阶段。新流程分为两步:首先针对数学、代码、Agent 及指令跟随等领域分别训练领域专家(SFT + GRPO 强化学习);随后以多教师 OPD 将十余个专家的能力蒸馏至统一模型,通过 logit 对齐避免传统方法中常见的能力冲突。
报告同时引入生成式奖励模型(Generative Reward Model,GRM),针对难以用规则验证的任务,以少量多样化人工标注数据训练,让模型同时承担生成与评估功能。
基准测试成绩:编码领先,知识推理仍有差距
根据 DeepSeek V4 技术报告,V4-Pro-Max 与 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的对比结果(不含近期发布的 GPT-5.5 及 Opus 4.7):
Codeforces:3206(GPT-5.4:3168 / Gemini 3.1 Pro:3052)→ 全场最高
LiveCodeBench:93.5 → 全场最高
SWE Verified:80.6,落后 Opus 4.6 的 80.8 差 0.2 个百分点
GPQA Diamond:90.1,落后 Gemini 3.1 Pro 的 94.3
SimpleQA-Verified:57.9,落后 Gemini 3.1 Pro 的 75.6
HLE:37.7,落后 Gemini 3.1 Pro 的 44.4
技术报告同时指出,上述对比不含最近发布的 GPT-5.5 及 Opus 4.7,V4 与最新一代闭源模型的差距有待第三方评测验证。
常见问题
DeepSeek V4 预览版的开源许可条款为何,可在哪里取得?
根据 DeepSeek 4 月 24 日的官方公告,V4 系列以 MIT 许可协议开源,模型权重已上线 Hugging Face 及 ModelScope,适用于商业与学术用途。
DeepSeek V4-Pro 与 V4-Flash 的参数规模有何差异?
根据 DeepSeek V4 技术报告,V4-Pro 总参数为 1.6T,每 token 激活 49B;V4-Flash 总参数为 284B,每 token 激活 13B,两款均支持 1M token 上下文。
DeepSeek V4-Pro-Max 与 GPT-5.4 及 Gemini 3.1 Pro 的基准比较结果为何?
根据 DeepSeek V4 技术报告,V4-Pro-Max 在 Codeforces(3206 分)及 LiveCodeBench(93.5)两项基准超越 GPT-5.4 及 Gemini 3.1 Pro,但在知识密集型基准(GPQA Diamond、SimpleQA-Verified、HLE)上仍落后 Gemini 3.1 Pro;比较组不含 GPT-5.5 及 Opus 4.7。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
马斯克与 OpenAI 执行长诉讼今开庭!Elon Musk 怒呛:骗子 Altman
马斯克与 OpenAI 的诉讼在加州开庭,马斯克先在 X 平台连番炮轰,称 Altman 为“骗子 Altman”,指控 Altman 与布罗克曼偷走慈善机构,诉讼被视为嫉妒与打压竞争。OpenAI 表示将在法庭揭示真相,诉讼金额高达 1,340 亿美元,分责任与赔偿两阶段,陪审团仅具咨询性,最终由法官裁定。
鏈新聞abmedia2小时前
Gemini 推出用于 AI 驱动自动化交易的代理式交易
加密交易所 Gemini 已推出 Agentic Trading(代理式交易),标志着首家受监管的美国交易所首次提供用于自动化交易的直接 AI 代理集成。该平台使用户能够连接 Claude、ChatGPT 和其他 AI 模型,以自动化交易策略,从简单挂单到
Crypto Frontier2小时前
超过580名谷歌员工要求CEO阻止五角大楼的AI合约
Gate 新闻讯息,4月27日——超过580名谷歌员工已签署一封公开信,敦促首席执行官桑达尔·皮查伊(Sundar Pichai)阻止五角大楼使用该公司的人工智能技术用于军事应用。签署人包括超过18名高级员工,涵盖从负责人和总监到副总裁等各个层级,他们指出,人工智能系统被部署到致命自主武器上存在伦理方面的担忧。
GateNews3小时前
AlphaGo 之父 11 亿美元种子轮:欧洲史上最大、估值 51 亿美元
根据 Cooley 律师事务所 4 月 27 日代发新闻稿,伦敦 AI 研究公司 Ineffable Intelligence 完成 11 亿美元($1.1B)种子轮融资、投后估值 51 亿美元($5.1B),由 Sequoia Capital 与 Lightspeed Venture Partners 共同领投,Google、Nvidia、Index Ventures 等跟投。这是欧洲历年规模最大的种子轮,也代表 AI 资本市场“ 不只押 LLM ”的新一波投资潮形成。
11 亿美元种子轮:欧洲史上最大、估值 51 亿美元
Ineffable Intelligence 此次融资直接超越过往歐
鏈新聞abmedia3小时前
S&P 500 Job Count Drops 400,000 as AI Boom Reshapes Corporate America
Gate News 消息,4 月 27 日——标普 500 指数成分公司就业人数在 2026 年减少了约 400,000 人,降至 2810 万,成为自 2016 年以来的首个年度下滑。此前连续八年不间断的就业增长。根据 The Kobeissi Letter 的说法,包括亚马逊在内的主要企业正在推动这种下滑:亚马逊削减 16,000 个企业岗位,Meta 裁减 8,000 个岗位,以及微软向 8,750 名员工提供自愿离职方案,因为它们将预算转向 AI 基础设施和项目。
其他重要因素还包括 UPS 减少 48,000 个岗位,花旗集团裁减 20,000 个岗位,以及戴尔取消 12,500 个岗位。与以往的工厂自动化浪潮不同,AI 正在对软件开发、金融和客户服务等白领行业造成更为不成比例的影响。到 2026 年初,营销和数据分析等受 AI 影响领域的职位空缺已下跌 25-31%,因为企业等待 AI 生产力的提升落地。
波士顿咨询集团(Boston Consulting Group)研究人员估计,到 2029 年,50-55% 的美国工作岗位将被 AI 重塑,这意味着需要进行大量技能提升,而非单纯替代。“即使这份工作还在,人们在这些岗位上所做的事情也会不同,”BCG 董事总经理兼高级合伙人 Matthew Kropp 表示,并指出公司必须投入精力对员工进行再培训。过去七年里,初级开发者招聘已暴跌 55%;Salesforce 最近削减了 4,000 个支持岗位,理由是如今 AI 已管理超过 50% 的客户互动。银行预计,随着 AI 在未来 3-5 年内承接后台任务,将消除大约 200,000 个岗位;而 31% 的法律助理及律师助理职责正日益被自动化。
一个值得注意的脱钩现象正在出现:当人们因 AI 乐观情绪而推高股价时,就业招聘信息却在减少;Meta 在公布与 AI 相关的裁员消息后,股价上涨了将近 4%。高盛分析师已警告称,AI 驱动的岗位替代可能会超过经济的就业创造能力,从而可能影响 2026 年的失业率。然而,AI 超级用户——那些能够监督 AI 工作流程的人——正在获得可观的工资溢价;与此同时,IBM 等公司正一边削减行政岗位,一边为高技能的 AI 工程以及数据监督岗位进行招聘。
GateNews3小时前
ConsenSys,Joseph Lubin 向 DeFi United 捐赠 30,000 ETH
Consensys 和以太坊联合创始人 Joseph Lubin 已确认他们将向 DeFi United 贡献 30,000 ETH,该项目是一项协调的救助行动,旨在应对 Kelp DAO 被利用事件造成的损失。根据 Aave 在周一的公告,这代表了正在进行的该行动中规模最大的捐助之一,whic
Crypto Frontier4小时前