Бенчмаркінг насправді — це перетворення цінностей у код.



Усі наші очікування та страхи щодо ШІ жорстко вміщені у ті речі, що можуть ставити оцінки — що вважається прогресом, чого варто боятися, що потрібно оптимізувати, — і в кінці кінців потрібно робити вигляд, що ці речі дійсно можна точно кількісно виміряти. Проблема в тому, що деякі речі взагалі не можна виміряти. За вибраними показниками часто ховаються припущення самих розробників. Те, що ви обрали для оцінки, фактично визначає, яким має бути ШІ. Навпаки, те, що не було обрано, можливо, є найважливішим.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 10
  • Репост
  • Поділіться
Прокоментувати
0/400
Hash_Banditvip
· 6год тому
Бенчмарки — це просто чиїсь переконання, перетворені на рівняння, чесно. Я спостерігаю за цим з перших днів, і це буквально одна й та сама стратегія — обирати метрики, які здаються об'єктивними, прикидатися, що вони враховують усе важливе, а потім дивуватися, коли сліпі зони тебе підводять. Невимірювані речі завжди перемагають у кінці, завжди.
Переглянути оригіналвідповісти на0
Rekt_Recoveryvip
· 12год тому
Ні, це дійсно по-іншому... нагадує мені той момент, коли мене ліквідували через погоню за показником, який виглядав добре на папері. Виявляється, оптимізація під неправильний сигнал — це шлях до краху. 🚨
Переглянути оригіналвідповісти на0
SignatureLiquidatorvip
· 01-12 10:06
Індикатори — це всього лише ілюзія, вибираєш — бачиш, що хочеш; те, що не видно — справді страшно
Переглянути оригіналвідповісти на0
EternalMinervip
· 01-12 08:58
Говорити правильно, індикатори — це саме влада
Переглянути оригіналвідповісти на0
PanicSellervip
· 01-12 08:54
Базовий — це гра за право голосу, хто встановить показники, той і виграє
Переглянути оригіналвідповісти на0
GateUser-7b078580vip
· 01-12 08:52
Дані показують, що сама система оцінювання є несправедливою, але хто визначив обрані показники? Майнерів занадто багато, і базові тести теж.
Переглянути оригіналвідповісти на0
ChainBrainvip
· 01-12 08:45
Блін, ось чому ті рейтинги — повна маячня
Переглянути оригіналвідповісти на0
MetaMiseryvip
· 01-12 08:35
Це справжня правда, хто встановлює показники, той і контролює мову
Переглянути оригіналвідповісти на0
TokenTherapistvip
· 01-12 08:30
嗯…Бенчмаркінг — це коли хтось закодує свої цінності, і саме тут полягає проблема --- Дійсно, ті речі, які не увійшли до показників, справді страшні --- Отже, по суті, дизайнери грають у владу за допомогою цифр --- Кількісна оцінка сама по собі є формою відбору, дуже жорстко сказано ха-ха --- Якщо показники затверджені, вони стають самореалізуючимися пророчествами --- Щоразу дивлюсь на бенчмарк і хочу запитати: хто сказав, що ці речі потрібно вимірювати --- Найбільш безглуздо — це імітація точної кількісної оцінки, яка нібито може вирішити проблему цінностей
Переглянути оригіналвідповісти на0
TopBuyerBottomSellervip
· 01-12 08:28
Ось чому ці рейтинги — це маячня, якщо правильно обрати показники, гра виграє.
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріпити