พนักงาน OpenAI ประชุมสาธารณะว่า xAI รุ่นล่าสุดโมเดล AI ชื่อ Grok3 มีผลทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่สร้างความเข้าใจผิด

ดำเนินการเจนเนเรชั่นบทคัดย่อ

ChainCatcher รายงานว่า ตามรายงานจาก Jinshi OpenAI พนักงานหนึ่งของบริษัท xAI ภายใต้การคุมของ Elon Musk กล่าวถึงผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะของโมเดล AI ล่าสุด Grok3 ซึ่งมีความเท็จของมัน ในขณะเดียวกัน ผู้ร่วมก่อตั้งของ xAI Igor Babushkin ยืนกรานว่า บริษัทไม่ได้กระทำผิด กราฟ xAI แสดงให้เห็นว่ารุ่น Grok3 ทั้งสองรุ่น คือ Grok3 Reasoning Beta และ Grok3 mini Reasoning มีผลงานที่ดีกว่ารุ่น o3-mini-high ที่แข็งแกร่งที่สุดของ OpenAI ใน AIME 2025 อย่างไรก็ตาม พนักงานของ OpenAI รีบชี้แจงในแพลตฟอร์ม X ว่า กราฟ xAI ไม่ได้รวมคะแนน AIME 2025 ของ o3-mini-high ภายใต้เงื่อนไข "cons@64" บูชคินอ้างว่าในแพลตฟอร์ม X OpenAI ยังเคยมีการเผยแพร่กราฟทดสอบที่เปรียบเทียบเกณฑ์เปรียบเทียบสมรรถนะที่สร้างความเข้าใจผิด ๆ อย่างเดียว แม้ว่ากราฟเหล่านั้นจะถูกใช้เปรียบเทียบประสิทธิภาพโมเดลของตนเอง

XAI5.89%

GROK3.69%

ดูต้นฉบับ

เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม

1ถูกใจ

รางวัล
1
แสดงความคิดเห็น
แชร์

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น

หัวข้อถ่ายทอดสด
#BTC#
191939 โพสต์
#ETH#
119484 โพสต์
#PI#
95286 โพสต์
4#GateioInto11#
75959 โพสต์
5#ContentStar#
63768 โพสต์
6#BOME#
58991 โพสต์
7#GT#
55754 โพสต์
8#DOGE#
52581 โพสต์
9#MAGA#
51266 โพสต์
10#SLERF#
50237 โพสต์

ปักหมุด

แผนผังเว็บไซต์