الاختبار المرجعي هو في الواقع كتابة القيم كمبرمجيات.



كل توقعاتنا ومخاوفنا من الذكاء الاصطناعي تم دفعها بقوة إلى تلك الأدوات التي يمكنها تقييم الأداء — ما هو التقدم، ما الذي يجب أن نخاف منه، ما الذي يجب تحسينه، وفي النهاية يجب أن نتظاهر بأن هذه الأشياء يمكن قياسها بدقة. المشكلة هي أن بعض الأشياء لا يمكن قياسها أصلاً. وراء المعايير المختارة، غالبًا ما تكمن افتراضات المصمم نفسه. اختيارك لمعيار معين يعادل تحديد شكل الذكاء الاصطناعي الذي يجب أن يكون عليه. وبالعكس، الأشياء التي لم تُختَر قد تكون الأهم حقًا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 9
  • إعادة النشر
  • مشاركة
تعليق
0/400
Rekt_Recoveryvip
· منذ 6 د
لا، هذا يختلف حقًا... يذكرني عندما تم تصفيتي وأنا ألاحق مقياسًا بدا جيدًا على الورق. اتضح أن تحسين الإشارة الخاطئة هو ما يؤدي إلى الانفجار. 🚨
شاهد النسخة الأصليةرد0
SignatureLiquidatorvip
· منذ 17 س
المؤشرات هي مجرد حيلة بصرية، تختار ما تراه وما لا تراه هو الأكثر رعبًا
شاهد النسخة الأصليةرد0
EternalMinervip
· منذ 18 س
قول صحيح، المؤشرات هي في الحقيقة السلطة
شاهد النسخة الأصليةرد0
PanicSellervip
· منذ 18 س
المعيار هو لعبة السيطرة على الخطاب، من يحدد المعايير هو الذي يفوز
شاهد النسخة الأصليةرد0
GateUser-7b078580vip
· منذ 18 س
تُظهر البيانات أن نظام التقييم هذا غير منطقي من الأساس، ولكن من الذي يحدد المعايير المختارة؟ المعدنون يأكلون الكثير، والاختبارات المرجعية أيضًا.
شاهد النسخة الأصليةرد0
ChainBrainvip
· منذ 19 س
يا إلهي، لهذا السبب تكون تلك القوائم التصنيفية كلها هراء
شاهد النسخة الأصليةرد0
MetaMiseryvip
· منذ 19 س
هذه هي الحقيقة، من يحدد المعايير هو من يملك حق الكلام
شاهد النسخة الأصليةرد0
TokenTherapistvip
· منذ 19 س
嗯…الاختبار المرجعي هو تحويل من يملك القيم إلى رمز برمجي، وهذه هي المشكلة في الواقع --- حقًا، الأشياء التي لم تُدرج في المؤشرات هي الأكثر رعبًا --- لذا، ببساطة، المصممون يلعبون لعبة السلطة باستخدام الأرقام --- الكمية نفسها نوع من الانتقاء، كلامي صار حاسمًا جدًا هاها --- بمجرد تحديد المؤشر، يتحول إلى نبوءة تحقق ذاتها --- كلما نظرت إلى الاختبار المرجعي، أريد أن أسأل: من قال إن هذه الأشياء يجب قياسها --- الأكثر جنونًا هو التظاهر أن القياس الدقيق يمكن أن يحل مشكلة القيم
شاهد النسخة الأصليةرد0
TopBuyerBottomSellervip
· منذ 19 س
هذه هي السبب في أن قوائم التصنيف هذه كلها هراء، إذا تم اختيار المؤشرات بشكل صحيح، فإن اللعبة ستفوز
شاهد النسخة الأصليةرد0
عرض المزيد
  • تثبيت