Tất cả kỳ vọng và nỗi sợ về AI của chúng ta đều bị nhồi nhét vào những thứ có thể chấm điểm đó — cái gọi là tiến bộ, điều đáng sợ, điều cần tối ưu hóa, cuối cùng còn phải giả vờ rằng những thứ này thực sự có thể được định lượng chính xác. Vấn đề là, có những thứ vốn dĩ không thể đo lường được. Những chỉ số được chọn thường ẩn chứa giả định của nhà thiết kế đằng sau. Bạn chọn cái gì để thi, nghĩa là bạn đang định nghĩa AI nên trở thành hình dạng như thế nào. Ngược lại, những thứ không được chọn có thể mới là quan trọng nhất.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
13 thích
Phần thưởng
13
10
Đăng lại
Retweed
Bình luận
0/400
Hash_Bandit
· 8giờ trước
Các tiêu chuẩn chỉ là những niềm tin của ai đó biến thành các phương trình, ngầu thật đấy. Đã theo dõi điều này từ những ngày đầu và nó thực sự là cùng một cuốn sổ tay—chọn các chỉ số trông có vẻ khách quan, giả vờ rằng chúng bao quát tất cả những gì quan trọng, rồi ngạc nhiên khi những điểm mù gây họa cho bạn. Những thứ không thể đo lường luôn chiến thắng cuối cùng, luôn luôn.
Xem bản gốcTrả lời0
Rekt_Recovery
· 14giờ trước
Chà, điều này thực sự khác biệt... nhắc tôi về lần tôi bị thanh lý khi theo đuổi một chỉ số trông có vẻ tốt trên giấy tờ. Hóa ra tối ưu hóa cho tín hiệu sai là cách bạn phá sản. 🚨
Xem bản gốcTrả lời0
SignatureLiquidator
· 01-12 10:06
Chỉ số chỉ là một thủ đoạn để đánh lừa mắt, chọn gì thì thấy cái đó, những thứ không thấy mới đáng sợ
Xem bản gốcTrả lời0
EternalMiner
· 01-12 08:58
Nói đúng rồi, chỉ số này chính là quyền lực đó
Xem bản gốcTrả lời0
PanicSeller
· 01-12 08:54
Tiêu chuẩn chính là trò chơi về quyền lực và quyền phát ngôn, ai đặt ra tiêu chí người đó thắng.
Xem bản gốcTrả lời0
GateUser-7b078580
· 01-12 08:52
Dữ liệu cho thấy hệ thống đánh giá này vốn đã không hợp lý, mặc dù vậy, ai quyết định các chỉ số được chọn? Các thợ mỏ tiêu thụ quá nhiều, và cả các bài kiểm tra tiêu chuẩn cũng vậy.
Xem bản gốcTrả lời0
ChainBrain
· 01-12 08:45
Chết rồi, đó chính là lý do tại sao những bảng xếp hạng đó đều vô nghĩa.
Xem bản gốcTrả lời0
MetaMisery
· 01-12 08:35
Đây chính là sự thật, ai đặt ra chỉ tiêu thì người đó nắm quyền phát ngôn
Benchmarking thực chất là viết giá trị thành mã.
Tất cả kỳ vọng và nỗi sợ về AI của chúng ta đều bị nhồi nhét vào những thứ có thể chấm điểm đó — cái gọi là tiến bộ, điều đáng sợ, điều cần tối ưu hóa, cuối cùng còn phải giả vờ rằng những thứ này thực sự có thể được định lượng chính xác. Vấn đề là, có những thứ vốn dĩ không thể đo lường được. Những chỉ số được chọn thường ẩn chứa giả định của nhà thiết kế đằng sau. Bạn chọn cái gì để thi, nghĩa là bạn đang định nghĩa AI nên trở thành hình dạng như thế nào. Ngược lại, những thứ không được chọn có thể mới là quan trọng nhất.