DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接

本地 AI 模型運行工具 Ollama 於 4/24 在 X 平台公開宣布,將中國 AI 新創 DeepSeek 前一日釋出的 V4-Flash 模型納入 Ollama Cloud 服務。推論主機位於美國,並提供三組一鍵指令讓開發者直接把 V4-Flash 接到 Claude Code、OpenClaw 與 Hermes 等主流 AI 程式開發工作流中。

deepseek-v4-flash 现在可在 Ollama 的云端使用!托管在美国。使用 Claude Code 试试:ollama launch claude –model deepseek-v4-flash:cloud 使用 OpenClaw 试试:ollama launch openclaw –model deepseek-v4-flash:cloud 使用 Hermes 试试:ollama launch hermes…

— ollama (@ollama) 2026 年 4 月 24 日

DeepSeek V4 预览:两款尺寸、1M 上下文

根据 DeepSeek 官方 API 文档 4/24 发布公告,DeepSeek-V4 Preview 分两款尺寸同步开源发布:

型号 总参数 活跃参数 定位 DeepSeek-V4-Pro 1.6 兆 490 亿 目标对标闭源旗舰 DeepSeek-V4-Flash 2,840 亿 130 亿 快速、高效、低成本

两款均采用 Mixture-of-Experts(MoE)架构,原生支持 100 万 tokens 长上下文。DeepSeek 在公告中宣告:“1M 上下文现在是所有 DeepSeek 官方服务的默认值。”

架构创新:DSA 稀疏注意力+Token-wise 压缩

V4 系列核心的架构改进包含:

Token-wise 压缩搭配 DSA(DeepSeek Sparse Attention)——针对超长上下文下的推理运算与 KV 缓存内存大幅削减成本

相较 V3.2,V4-Pro 在 100 万 tokens 上下文场景下,每个 token 推理仅需 27% 的 FLOPs、KV cache 仅需 10%

支持 Thinking 与 Non-Thinking 双模式切换,对应不同任务的深度推理需求

API 层面同时兼容 OpenAI ChatCompletions 与 Anthropic APIs 规格,降低既有 Claude/GPT 客户端的迁移成本。

Ollama Cloud 的三组一键启动指令

Ollama 官方模型页以模型标识符 deepseek-v4-flash:cloud 提供云端推理服务,开发者可用以下三组指令直接把 V4-Flash 串到既有 AI 程式开发工作流:

工作流 指令 Claude Code ollama launch claude --model deepseek-v4-flash:cloud OpenClaw ollama launch openclaw --model deepseek-v4-flash:cloud Hermes ollama launch hermes

值得留意的是“美国主机”这个信号。对企业与欧美开发者而言,使用中国开源模型时最大疑虑是数据回传中国;Ollama 选择把 V4-Flash 的推理层放在美国,意味着 prompt 与程式码内容不离开美国司法管辖,降低合规与数据主权层面的摩擦。

为什么这件事对 AI 产业重要

把 DeepSeek V4-Flash、Ollama Cloud、Claude Code 三个原本各自独立的生态接起来,产生三层意义:

成本路线:V4-Flash 的 130 亿活跃参数远小于 GPT-5.5(输入 5 美元、输出 30 美元/百万 tokens)与 Claude Opus 4.7 等旗舰,对于中小型代理任务、批次摘要、测试自动化等用途,单位成本有望显著下降

地缘风险的中介层:Ollama 作为美国注册的中介推理层,让中国原生模型的企业用户得以绕开“资料直接送 DeepSeek 北京服务器”的疑虑,是开源模型在国际扩散的实务解法

开发者即刻切换:Claude Code 与 OpenClaw 的用户可在命令列一行切模型,不必改 prompt 结构或 IDE 设置,对于“多模型回归测试”“成本敏感的批次任务”使用场景是真正的生产力释放

与先前 DeepSeek 新闻的联动

这次 V4 发布与 Ollama Cloud 快速整合,发生在 DeepSeek 正在洽谈首轮外部融资、估值 200 亿美元的背景下。V4 是 DeepSeek 公司资本化过程中的关键产品证明;以开源策略+国际主机合作伙伴快速扩散,则是其在建立开发者生态垄断前的速度战。对 OpenAI 与 Anthropic 而言,一个可以在 Claude Code 内部一行切换的开源替代模型,是 agent 工作流主导权争夺的新变量。

这篇文章 DeepSeek V4-Flash 登上 Ollama Cloud、美国主机:Claude Code、OpenClaw 一键串接 最早出现在 鏈新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

马斯克与 OpenAI 执行长诉讼今开庭!Elon Musk 怒呛:骗子 Altman

马斯克与 OpenAI 的诉讼在加州开庭,马斯克先在 X 平台连番炮轰,称 Altman 为“骗子 Altman”,指控 Altman 与布罗克曼偷走慈善机构,诉讼被视为嫉妒与打压竞争。OpenAI 表示将在法庭揭示真相,诉讼金额高达 1,340 亿美元,分责任与赔偿两阶段,陪审团仅具咨询性,最终由法官裁定。

鏈新聞abmedia2小时前

Gemini 推出用于 AI 驱动自动化交易的代理式交易

加密交易所 Gemini 已推出 Agentic Trading(代理式交易),标志着首家受监管的美国交易所首次提供用于自动化交易的直接 AI 代理集成。该平台使用户能够连接 Claude、ChatGPT 和其他 AI 模型,以自动化交易策略,从简单挂单到

Crypto Frontier2小时前

超过580名谷歌员工要求CEO阻止五角大楼的AI合约

Gate 新闻讯息,4月27日——超过580名谷歌员工已签署一封公开信,敦促首席执行官桑达尔·皮查伊(Sundar Pichai)阻止五角大楼使用该公司的人工智能技术用于军事应用。签署人包括超过18名高级员工,涵盖从负责人和总监到副总裁等各个层级,他们指出,人工智能系统被部署到致命自主武器上存在伦理方面的担忧。

GateNews3小时前

AlphaGo 之父 11 亿美元种子轮:欧洲史上最大、估值 51 亿美元

根据 Cooley 律师事务所 4 月 27 日代发新闻稿,伦敦 AI 研究公司 Ineffable Intelligence 完成 11 亿美元($1.1B)种子轮融资、投后估值 51 亿美元($5.1B),由 Sequoia Capital 与 Lightspeed Venture Partners 共同领投,Google、Nvidia、Index Ventures 等跟投。这是欧洲历年规模最大的种子轮,也代表 AI 资本市场“ 不只押 LLM ”的新一波投资潮形成。 11 亿美元种子轮:欧洲史上最大、估值 51 亿美元 Ineffable Intelligence 此次融资直接超越过往歐

鏈新聞abmedia3小时前

S&P 500 Job Count Drops 400,000 as AI Boom Reshapes Corporate America

Gate News 消息,4 月 27 日——标普 500 指数成分公司就业人数在 2026 年减少了约 400,000 人,降至 2810 万,成为自 2016 年以来的首个年度下滑。此前连续八年不间断的就业增长。根据 The Kobeissi Letter 的说法,包括亚马逊在内的主要企业正在推动这种下滑:亚马逊削减 16,000 个企业岗位,Meta 裁减 8,000 个岗位,以及微软向 8,750 名员工提供自愿离职方案,因为它们将预算转向 AI 基础设施和项目。 其他重要因素还包括 UPS 减少 48,000 个岗位,花旗集团裁减 20,000 个岗位,以及戴尔取消 12,500 个岗位。与以往的工厂自动化浪潮不同,AI 正在对软件开发、金融和客户服务等白领行业造成更为不成比例的影响。到 2026 年初,营销和数据分析等受 AI 影响领域的职位空缺已下跌 25-31%,因为企业等待 AI 生产力的提升落地。 波士顿咨询集团(Boston Consulting Group)研究人员估计,到 2029 年,50-55% 的美国工作岗位将被 AI 重塑,这意味着需要进行大量技能提升,而非单纯替代。“即使这份工作还在,人们在这些岗位上所做的事情也会不同,”BCG 董事总经理兼高级合伙人 Matthew Kropp 表示,并指出公司必须投入精力对员工进行再培训。过去七年里,初级开发者招聘已暴跌 55%;Salesforce 最近削减了 4,000 个支持岗位,理由是如今 AI 已管理超过 50% 的客户互动。银行预计,随着 AI 在未来 3-5 年内承接后台任务,将消除大约 200,000 个岗位;而 31% 的法律助理及律师助理职责正日益被自动化。 一个值得注意的脱钩现象正在出现:当人们因 AI 乐观情绪而推高股价时,就业招聘信息却在减少;Meta 在公布与 AI 相关的裁员消息后,股价上涨了将近 4%。高盛分析师已警告称,AI 驱动的岗位替代可能会超过经济的就业创造能力,从而可能影响 2026 年的失业率。然而,AI 超级用户——那些能够监督 AI 工作流程的人——正在获得可观的工资溢价;与此同时,IBM 等公司正一边削减行政岗位,一边为高技能的 AI 工程以及数据监督岗位进行招聘。

GateNews3小时前

ConsenSys,Joseph Lubin 向 DeFi United 捐赠 30,000 ETH

Consensys 和以太坊联合创始人 Joseph Lubin 已确认他们将向 DeFi United 贡献 30,000 ETH,该项目是一项协调的救助行动,旨在应对 Kelp DAO 被利用事件造成的损失。根据 Aave 在周一的公告,这代表了正在进行的该行动中规模最大的捐助之一,whic

Crypto Frontier4小时前
评论
0/400
暂无评论