Grok 4.1へのほぼ無制限のアクセスがあったとしても、xAIとCursorは最終的にOpus 4.5を選んだことは示唆的です。これは、実世界のパフォーマンスにおける異なるモデル間の実際のギャップについて多くを物語っています。この選択は、より深い何かを示唆しています—テスト時の計算能力だけではすべてを解決できないということです。時には、生の推論能力よりも、他のモデルがもたらす何らかの優位性が優先されることもあります。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 7
  • リポスト
  • 共有
コメント
0/400
consensus_failurevip
· 11時間前
アルゴリズムの選択は決して嘘をつかないし、リソースがあればOpusを選ぶ。これはGrokの自慢が少し多いことを示している。
原文表示返信0
TradFiRefugeevip
· 16時間前
どうやらOpusにはまだ少しだけ可能性があるようだ。単にハッシュレートを積み上げるだけでは状況を打開できない。
原文表示返信0
EternalMinervip
· 01-10 21:02
これは非常に面白いですね。Grokがどれだけ強くてもOpusに道を譲らなければならず、実戦でのパフォーマンスこそが真の英雄であることを示しています。
原文表示返信0
LiquidationWizardvip
· 01-10 21:00
うーん…要するに計算能力ではできないことだね、Opusにはまだ何かあるよ。
原文表示返信0
NotSatoshivip
· 01-10 20:50
うーん…正直ちょっと心が痛いですね。grokを長い間推してきたのに、結局相手はopusを選んだというのは、ちょっと気まずいです。
原文表示返信0
CryptoPunstervip
· 01-10 20:41
笑死,Grok 4.1再牛逼也抵不过人家実際に使えることだよね。これが全掛けと確実に稼ぐの違いだよ
原文表示返信0
Web3Educatorvip
· 01-10 20:33
ngl 彼らがgrokを捨ててopusにした事実は、ベンチマークと実際のユーティリティについてすべてを物語っている... テスト時の計算量は結局のところただの数字に過ぎない
原文表示返信0
  • ピン