Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
Gemini 3 Flash登顶:谷歌新模型以速度、经济性和性能无妥协挑战OpenAI
Google 已正式推出 Gemini 3 Flash,将其定位为全球 Gemini 平台的默认模型。这一亮相标志着在与 OpenAI 的技术竞赛中取得了重大加速,山景城的公司通过其 API 已经每天处理超过 1 万亿个 token。
令人惊叹的性能:数字说话
这次发布的有趣之处不仅在于速度——这是一个经常会提及的主题——还在于那些打破任何犹豫的基准测试。在 Humanity’s Last Exam 测试中,Gemini 3 Flash 得分为 33.7%,几乎与 GPT-5.2 (34.5%) 持平,也不远离 Google 的 Pro (37.5%)。区别在哪里?Flash 价格更低,速度更快。
但真正的杀手锏在于 MMMU-Pro 多模态推理基准测试中,新模型以 81.2% 的成绩碾压竞争对手,几乎击败所有对手。这些数字不仅仅是纸面上的:意味着你可以上传视频、音频、绘图,获得复杂的回答,无需等待数分钟。
速度作为竞争武器:速度选择器为用户服务
Google 有意强调了一个关键点:新模型的速度是 Gemini 2.5 Pro 的三倍。这不仅是一个技术指标,更是一种切实的体验。Gemini 应用现在提供了隐式的速度选择器:你几乎可以用 Flash 来处理所有任务——视频分析、数据提取、视觉推理——而不影响质量,或者选择 Pro 模型应对高级编程或复杂数学问题。
这种灵活性是经过战略设计的。对于推理任务,新模型的 token 消耗比 2.5 Pro 少 30%,这为企业带来了实际的节省,即使每个 token 的价格略有上涨。
价格讲述的故事:经济效率
Gemini 3 Flash 每百万输入 token 收费 0.50 美元,每百万输出 token 收费 3.00 美元,而之前的模型分别为 0.30 和 2.50 美元。显而易见的问题是:为什么要多付钱?
答案在于速度与效率的结合。如果模型速度提升三倍,且在某些任务中 token 使用减少 30%,那么每次交易的总成本实际上可能会降低。Gemini 高级产品总监 Tulsee Doshi 强调:“Flash 是企业处理大量请求的工作模型。”它不是最智能的模型,而是最具经济智能的模型。
已经投入使用:JetBrains、Figma、Harvey 不等待
Google 不谈未来可能性,而是强调现有的应用场景。JetBrains、Figma、Cursor、Harvey 和 Latitude 等公司已经通过 Vertex AI 和 Gemini Enterprise 利用 Gemini 3 Flash。对于开发者,模型已在 API 和上个月推出的编程工具 Antigravity 中提供预览。
在经过 SWE-bench 编程验证的基准测试中,模型获得了 78% 的成绩,仅次于 GPT-5.2。这意味着它在实际编码任务中足够复杂,虽然在复杂算法和边界优化方面不是最佳选择。
AI 战争的背景:到底发生了什么
这次发布并非无的放矢。几周前,Sam Altman 内部发出“Code Red”备忘录,因为 ChatGPT 的流量下降,而 Google 在消费者中的份额在增长。OpenAI 通过发布 GPT-5.2 和新一代图像生成模型回应,声称自 2024 年 11 月以来消息量增长了 8 倍。
Google 并未直接卷入这场争论。Doshi 选择了外交的语调:“事情是这样的,这些模型都非常出色,彼此竞争,推动边界。我觉得企业发布这些模型是非常棒的事情。”
翻译:是的,竞争激烈,但 Google 将其视为推动创新的积极动力。
全球可用性:从今天起成为默认模型
Gemini 3 Flash 将取代 Gemini 2.5 Flash,成为 Gemini 应用和 AI 搜索的默认模型。全球用户无需操作:会立即看到新模型。喜欢 Pro 模型的用户仍可在菜单中选择。
该模型目前在美国提供搜索功能,全球推广正在进行中。应用支持上传视频、音频、草图、文档——模型会进行处理并生成分析、测验、建议、表格。
Gemini 3 Flash 并非最强大的模型,但在经济性和速度方面是最聪明的模型。在所有参与者都获得类似技术点的竞争中,胜者是能以更快速度、更具竞争力的价格提供结果的那一方。这也是 Google 选择的差异化策略。