Це свідчить про те, що навіть при фактично необмеженому доступі до Grok 4.1, xAI і Cursor зрештою обрали Opus 4.5. Це багато говорить про реальний розрив у продуктивності між різними моделями у реальних умовах. Вибір натякає на щось глибше — обчислювальна потужність під час тестування сама по собі не вирішує все. Іноді сирий потенціал для виведення програє тому, яку перевагу інша модель може запропонувати.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
13 лайків
Нагородити
13
8
Репост
Поділіться
Прокоментувати
0/400
DAOdreamer
· 19год тому
ngl, це означає, що обчислювальна потужність світлового стосу справді недостатня, opus все ще має свої переваги
Переглянути оригіналвідповісти на0
consensus_failure
· 01-11 21:44
Вибір алгоритму ніколи не бреше, і при наявності ресурсів обрали Opus, що свідчить про те, що у Grok дійсно є багато пустих слів.
Переглянути оригіналвідповісти на0
TradFiRefugee
· 01-11 16:39
Здається, Opus все ж має деякий потенціал, лише нарощуванням обчислювальної потужності ситуацію не врятувати
Переглянути оригіналвідповісти на0
EternalMiner
· 01-10 21:02
Це дуже цікаво, Grok навіть якщо сильний, має поступитися Opus, що показує, що реальна бойова ефективність — це справжній герой
Переглянути оригіналвідповісти на0
LiquidationWizard
· 01-10 21:00
Ну... по суті, це те, що не можна отримати за допомогою обчислювальної потужності, але у Opus все ще є свої переваги.
Переглянути оригіналвідповісти на0
NotSatoshi
· 01-10 20:50
Ну... чесно кажучи, це трохи боляче, grok так довго хвалили, а вони все ще обрали opus, і це незручно.
Переглянути оригіналвідповісти на0
CryptoPunster
· 01-10 20:41
Смішно, Grok 4.1 навіть не зрівняється з тим, що реально можна використовувати, ось у чому різниця між ризикованою ставкою і стабільним заробітком
Переглянути оригіналвідповісти на0
Web3Educator
· 01-10 20:33
ngl факт того, що вони відмовилися від grok на користь opus, говорить все про бенчмарки проти фактичної корисності... обчислення під час тестування — це просто число в кінці дня
Це свідчить про те, що навіть при фактично необмеженому доступі до Grok 4.1, xAI і Cursor зрештою обрали Opus 4.5. Це багато говорить про реальний розрив у продуктивності між різними моделями у реальних умовах. Вибір натякає на щось глибше — обчислювальна потужність під час тестування сама по собі не вирішує все. Іноді сирий потенціал для виведення програє тому, яку перевагу інша модель може запропонувати.