🚨 АНТРОПІЧНІ НАСТАНОВЛЕННЯ ВСТАНОВЛЮЮТЬ НОВУ БАЗОВУ ЛІНІЮ З CLAUDE OPUS 4.7


Це вимірюваний крок вперед у продуктивності агентів.
64,3% на SWE-бенчмарку, з 53,4%
87,6% на перевіреному агентському кодуванні
77,3% на масштабованому використанні інструментів
78,0% на реальних комп’ютерних завданнях
Це також покращує там, де моделі зазвичай погіршуються:
79,3% на агентському пошуку
64,4% на фінансовому аналізі
91,5% на багатомовних питаннях і відповідях
І критично, довгий контекстовий розуміння тримається:
90%+ візуальне розуміння з інструментами
94,2% на рівні випускних іспитів
ОТЖЕ ВИСНОВОК:
Це не про пікові результати.
Це про послідовність у різних сферах.
Opus 4.7 не домінує у кожній категорії.
Але він надійно працює у всіх них.
Саме це потрібно виробничим системам.
Межа вже не лише інтелект.
Це стабільність під реальними навантаженнями.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити