Бенчмаркинг по сути сводится к тому, что ценности превращаются в код.



Все наши ожидания и страхи относительно ИИ жестко встраиваются в те вещи, которые могут выставлять оценки — что считать прогрессом, чему стоит бояться, что нужно оптимизировать, — и в конце концов приходится притворяться, что эти вещи действительно можно точно измерить. Проблема в том, что некоторые вещи изначально измерить невозможно. За выбранными показателями часто скрываются предположения разработчиков. То, какие показатели вы выбрали, равно как и определение того, каким должен быть ИИ, — это и есть ваше представление о его будущем. А наоборот, то, что не было выбрано, возможно, и есть самое важное.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • Репост
  • Поделиться
комментарий
0/400
SignatureLiquidatorvip
· 3ч назад
Индикаторы — это всего лишь уловки, выбираешь что видишь, а то, что скрыто, — вот что действительно страшно
Посмотреть ОригиналОтветить0
EternalMinervip
· 5ч назад
Говоря правильно, показатели — это именно власть
Посмотреть ОригиналОтветить0
PanicSellervip
· 5ч назад
Базовая — это игра в власть и дискурс, кто устанавливает показатели, тот и побеждает
Посмотреть ОригиналОтветить0
GateUser-7b078580vip
· 5ч назад
Данные показывают, что сама система оценки несправедлива, хотя, конечно, кто определил выбранные показатели? Майнеры получают слишком много, и бенчмарки тоже.
Посмотреть ОригиналОтветить0
ChainBrainvip
· 5ч назад
Черт, вот почему все эти рейтинги — полная ерунда
Посмотреть ОригиналОтветить0
MetaMiseryvip
· 5ч назад
Это и есть правда, тот, кто устанавливает показатели, тот и контролирует речь.
Посмотреть ОригиналОтветить0
TokenTherapistvip
· 5ч назад
嗯…基准测试就是把谁的价值观给代码化了,这才是问题所在吧 --- 真的,那些没被选进指标的东西才恐怖 --- 所以说白了就是设计者在用数字玩权力游戏 --- 量化本身就是一种筛选,说得太绝了哈哈 --- 指标一旦定下来就变成了自我实现的预言 --- 每次看benchmark我都想问:谁说这些东西该被量的 --- 最离谱的就是假装精确量化能解决价值观问题
Ответить0
TopBuyerBottomSellervip
· 5ч назад
Вот почему эти рейтинги — полная чепуха, если правильно выбрать показатели, игра выиграна
Посмотреть ОригиналОтветить0
  • Закрепить