GE-Sim 2.0 من Zhi Yuan: إنشاء العالم باستخدام World Model، ودفع خصم العالمين المنافس إلى التطور الذاتي عبر الروبوتات البشرية

ChainNewsAbmedia

تَواصُلُ الذكاء الجسدي (Embodied AI) يقترب من منعطفٍ محوري. أصدرت شركة Zhiren Robot الصينية (智元機器人) مؤخرًا Genie Envisioner World Simulator 2.0 (GE-Sim 2.0)، في محاولة لدفع نموذج العالم (World Model)—من مجرد أداة لفهم البيئة—إلى جهاز محاكاة للعالم (World Simulator) يمكنه تشغيل الروبوتات وتدريبها وتحسينها بشكل مباشر.

إذا كنت لا تعرف مدى أهمية ذلك بعد، فابدأ بالاطلاع على العيوب الجوهرية في بنية LLM: منطقيًا، تقوم نماذج LLM الحالية بتوقع السياق اعتمادًا على كمٍّ هائل من البيانات النصية، فهي قد تعرف أن كلمات مثل «Apple掉下來» تظهر غالبًا معًا، لكنها لا تفهم فعليًا علاقة السبب والنتيجة للثقل أو العالم الفيزيائي.

ولهذا السبب يندفع علماء مثل يانغ ليكون (杨立昆) ولي في-لي (李飞飞) إلى مسار World Model. فعندما يصبح لدى الذكاء الاصطناعي القدرة على فهم بيئات ثلاثية الأبعاد والتنبؤ بالفيزياء، ستتحول هذه التقنية إلى «الدماغ الرقمي» للذكاء الآلي المستقل مثل الروبوتات الذاتية، والقيادة الذاتية، والتصنيع الذكي ضمن ما يُسمى «الذكاء الاصطناعي المادي» (Physical AI). لذلك ترى خريطة طريق World Model أن الروبوتات ستكون حاملة بالغة الأهمية. والآن، عندما يدخل مصنعو الروبوتات المنزلية (等身機器人) مثل Zhiren Robot إلى الساحة، فهذا يرمز إلى الطليعة التي تقود صعود الصين من خلال التفوق في العتاد.

وفي السابق، كان رئيس مجلس إدارة شركة TSMC (台積電) وي تشيه-جيا (魏哲家) قد قال: إذا نظرت إلى الصين القارية وهي تصنع روبوتات تقفز هنا وهناك وتقفز وتثب، فهذا لا يفيد، إنها مجرد شكل جميل. وقد أشار إلى أن المفتاح هو جعل «دماغ الروبوت» يعمل، ومن الذي يصنعه؟ إن من يقوم بذلك هو Nvidia (، وAMD )، وكثير من الشركات الأمريكية، لكن 95% من الدماغ يتم تصنيعها بواسطة TSMC.

(深度解析:LLM 存在缺陷?為何楊立昆的 AMI 押注 World Model 路線)

تقول خريطة طريق World Model إن الروبوتات هي المفتاح

تعتمد نماذج LLM السائدة حاليًا على كمٍّ ضخم من بيانات النصوص والعلاقات الإحصائية لفهم السياق والتنبؤ بالكلمة التالية. يمكنها معرفة أن كلمات «Apple掉下來» تظهر غالبًا معًا، لكنها لا تفهم فعليًا علاقة السبب والنتيجة للثقل أو العالم الفيزيائي.

تتفوق هذه النمط في مهام توليد النصوص والمساعدة البرمجية والاستعلامات، لكن لا تزال هناك قيود جوهرية في السيناريوهات التي تتطلب فهم بنية العالم الواقعي واستدلال علاقات السبب والنتيجة والتخطيط طويل المدى. والمشكلة الأكبر هي أن مصادر البيانات آخذة في الجفاف تدريجيًا. يعتمد تدريب LLM بدرجة كبيرة على بيانات بشرية عالية الجودة، وفي السنوات الأخيرة بدأ الوسط المهني يحذر من أن البيانات النصية البشرية المتاحة قد تنفد خلال بضع سنوات قادمة. وعندها، كما يحدث مع زواج الأقارب الذي قد يورث عيوبًا، سينحرف النموذج تدريجيًا عن الواقع وتظهر تدهورات في الأداء.

(深度解析:LLM 存在缺陷?為何楊立昆的 AMI 押注 World Model 路線)

وهذا هو سبب اختيار شخصين بارزين في مجال أبحاث الذكاء الاصطناعي في السنوات الأخيرة—يانغ ليكون، و لي في-لي (Fei-Fei Li) المعروف بـ «أمينة الذكاء الاصطناعي»—الرهان على جيل جديد من بنى الذكاء الاصطناعي يُعرف باسم World Model (نموذج العالم).

في ذلك الوقت، كان الكاتب قد قال: إذا نظرنا إلى الأمر من زاوية أوسع، فإنه عندما يمتلك الذكاء الاصطناعي القدرة على فهم بيئات ثلاثية الأبعاد والتنبؤ بالفيزياء، ستصبح هذه التقنية «الدماغ الرقمي» للروبوتات المستقلة والقيادة الذاتية والتصنيع الذكي ضمن «الذكاء الاصطناعي المادي» (Physical AI). لذلك ترى خريطة طريق World Model أن الروبوتات ستكون حاملة بالغة الأهمية. والآن، مع دخول شركة Zhiren Robot، يرمز ذلك إلى طليعة الصين في تحدي التفوق عبر العتاد.

في السابق، قال رئيس مجلس إدارة TSMC، وي تشيه-جيا، صراحةً عند الحديث عن تطور الروبوتات وشبه الموصلات: إذا نظرت إلى الصين القارية وهي تصنع روبوتات تقفز هنا وهناك وتقفز وتثب، فهذا لا يفيد، إنها مجرد شكل جميل. وقد أشار إلى أن المفتاح هو جعل دماغ الروبوت قادرًا على العمل؛ فمن يقوم بذلك؟ إن «من يصنع الدماغ» هم Nvidia ( وAMD ) وكم هائل من الشركات الأمريكية، لكن 95% من الدماغ يتم تصنيعها بواسطة TSMC.

(台積電魏哲家酸:中國機器人蹦蹦跳,只是好看頭沒用!關鍵仍來自輝達)

تطور World Model: من فهم العالم إلى التعلم داخل العالم

خلال السنوات القليلة الماضية، ظل World Model يُنظر إليه كإحدى التقنيات المحورية لفهم الواقع بالذكاء الاصطناعي. من خلال الصور واللغة وبيانات الاستشعار، يمكن للنموذج التنبؤ بتغيرات البيئة، مما يمنح الروبوتات قدرات اتخاذ قرار أساسية.

لكن الاختراق الجوهري في GE-Sim 2.0 لا يكمن فقط في فهم العالم، بل في إدخال نظام التعلم والعمل داخل «العالم المُنشأ بواسطة النموذج» بوصفه حلقة عمل، مع تضمين Action (الإجراء) كمتغير جوهري، والانتقال من التنبؤ بالحالة التقليدي إلى حلقة كاملة:

State

Action

State Evolution

وهذا يعني أن الروبوت لم يعد يقتصر على الملاحظة والاستجابة، بل يمكنه التجربة الخطوة تلو الخطوة في بيئة محاكاة، والتحسين الذاتي، والتعلم المستمر. هذا التحول يجعل World Model يتطور من «نموذج إدراكي» إلى «بنية تحتية للتدريب».

GE-Sim 2.0: جعل الروبوتات «تتطور» داخل عالم افتراضي

يُعرّف GE-Sim 2.0 على أنه مجموعة من «مُحاكيات العالم الجسدي»، والهدف الأساسي هو معالجة ثلاث عنق زجاجات كبرى في تدريب الواقع: التكلفة المرتفعة جدًا، نقص البيانات، وصعوبة القياس على نطاق واسع. من خلال توليد بيئة عبر النموذج، يمكن للنظام تدريب الروبوتات على نطاق كبير دون الاعتماد على العالم الحقيقي.

تقنيًا، يقوم GE-Sim 2.0 بدمج ثلاث قدرات رئيسية: أولًا هي «توليد الصور المعتمد على الأفعال»، إذ يمكن للنموذج توليد المشاهد المستقبلية المقابلة بناءً على أفعال الروبوت، مع الحفاظ على اتساق متعدد زوايا الرؤية، بما في ذلك زاوية الرأس وزاوية操作 اليدين يمينًا ويسارًا.

ثانيًا هو نمذجة الإحساس بالجسم (proprioception)، فلا يقتصر الأمر على محاكاة المشاهد الخارجية، بل يمكنه أيضًا التنبؤ بحالة المفاصل وحركة الروبوت نفسه، بما يجعل عملية اتخاذ القرار أقرب إلى عالم الفيزياء الحقيقي.

ثالثًا هي «تقييم المهام تلقائيًا»، إذ عبر reward model (نموذج المكافأة) المدمج، يمكن للنظام تحديد ما إذا كانت المهمة قد اكتملت تلقائيًا، مثل «وضع الجسم الأزرق داخل الصندوق الأحمر»، وتقديم الملاحظات التي تُستخدم مباشرة في التعلم المعزز. وهذا يتيح للروبوت إكمال حلقة مغلقة كاملة داخل بيئة المحاكاة:

GE-Sim 2.0 أصبح قادرًا على تحقيق «توليد مقاطع فيديو بثبات على مستوى الدقائق»

مقارنةً بالنماذج المبكرة التي كانت تقتصر على توليد مقاطع قصيرة فقط، أصبح GE-Sim 2.0 قادرًا على تحقيق «توليد مقاطع فيديو بثبات على مستوى الدقائق»، ويدعم محاكاة مهام طويلة. وفي الوقت نفسه، وبفضل التدريب باستخدام بيانات واقعية واسعة النطاق (بيانات التشغيل عن بُعد، والنشر، والتفاعل)، يمتلك النموذج قدرة تعميم أقوى بين سيناريوهات ومهام مختلفة. وهذه النقطة حاسمة بشكل خاص للروبوتات ثنائية القدمين (المشابهة للإنسان): لأن تشغيل العالم الواقعي متغير للغاية ولا يمكن الاعتماد على التدريب على مشهد ثابت فقط.

ظهور World Simulator يعني أنه يمكن للروبوتات «التدرب بلا حدود» داخل العالم الافتراضي، ما سيؤدي إلى تغيرين بنيويين: أولًا، انخفاض كبير في تكاليف التدريب. ثانيًا، زيادة سرعة تطور القدرات بمعدل أُسّي.

智元機器人: قوة جديدة في مجال الروبوتات الثنائية الشبيهة بالإنسان في الصين

تأسست شركة 智元機器人 في عام 2023، على يد 彭志輝، «عبقري» هواوي، وهي تركز على مجال الذكاء الجسدي الذي يجمع بين الذكاء الاصطناعي والروبوتات.

تشمل المنتجات الأساسية للشركة:

سلسلة الروبوتات ثنائية الشبه بالإنسان «远征»

نظام الروبوتات «灵犀»

النموذج العام GO-1

وقد أنهت الشركة عدة جولات تمويل، وحصلت على استثمارات من مؤسسات مثل Sequoia China وHillhouse Capital، ويُنظر إليها بوصفها لاعبًا مهمًا في مجال الروبوتات الثنائية الشبيهة بالإنسان في الصين، في منافسة مع شركة宇树科技.

هذه المقالة 智元 GE-Sim 2.0:用 World Model 生成世界,宇树劲敌将人形机器人推向自我进化 تم ظهورها لأول مرة على 链新闻 ABMedia。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

سام ألتمان يفصّل مفاوضات فاشلة مع إيلون ماسك بشأن سيطرة OpenAI، والدعوى مزمّعة في 27 أبريل

ألتمان في "الذاكرة الأساسية" يستعرض فشل محادثات الحوكمة في OpenAI مع إيلون ماسك: مراحل من التنازل نحو نموذج يهدف إلى الربح، مطالب ماسك بحصة أغلبية والتحكم بمنصب الرئيس التنفيذي، وألتمان يعارض السلطة المطلقة، مع اقتراب المحاكمة. ملخص: سام ألتمان يوضح، في "الذاكرة الأساسية"، تفاصيل مفاوضات فاشلة مع إيلون ماسك بشأن حوكمة OpenAI، مع عرض خطوات نحو نموذج يهدف إلى الربح، ومطالب ماسك بحصة أغلبية وسلطة الرئيس التنفيذي، ورفض ألتمان للسيطرة المطلقة؛ الدعوى القضائية المتوقعة مع تحديد محاكمة في 27 أبريل.

GateNewsمنذ 6 د

Brockman يتولى تكامل المنتجات في OpenAI؛ Sora تم تخفيض تصنيفها بسبب "تباعد الفروع التقنية"

رسالة أخبار Gate، 22 أبريل — تولّى رئيس OpenAI، Greg Brockman، مهام التكامل الشامل لمنتجات الشركة وأبحاثها، وهو الدور الذي شغله لمدة تقارب "عدة أسابيع"، وفقًا لتصريحات أدلى بها في بودكاست Core Memory. وذكر الرئيس التنفيذي Sam Altman أن هذا التحول التنظيمي في الشركة قد جعلها داخليًا "أكثر سعادة بشكل ملحوظ."

GateNewsمنذ 10 د

Sam Altman 在播客中回应家中遭袭,预测将出现更多类似事件

Gate News 消息,4 月 22 日——OpenAI 首席执行官 Sam Altman 在一次 Core Memory 播客露面期间,首次公开回应了对其住所的两起袭击。Altman 表示,此类事件在未来很可能还会发生,尽管他没有展开说明袭击的细节

GateNewsمنذ 18 د

شانغهاي تُكمل تسجيل خدمة واحدة للذكاء الاصطناعي التوليدي، ليصل الإجمالي التراكمي إلى 158

تُبلّغ شانغهاي عن تسجيل خدمة جديدة للذكاء الاصطناعي التوليدي اعتبارًا من 21 أبريل 2026، ما يرفع إجمالي شانغهاي إلى 158 ضمن تدابير مؤقتة تتطلب التسجيل لدى الجهات التنظيمية. ملخص: يشير هذا البيان الموجز إلى أن إدارة الفضاء الإلكتروني في شانغهاي أعلنت أنه اعتبارًا من 21 أبريل 2026، اكتملت إجراءات تسجيل خدمة جديدة للذكاء الاصطناعي التوليدي، ما يرفع الإجمالي إلى 158. تأتي هذه الخطوة عقب «التدابير المؤقتة لإدارة خدمات الذكاء الاصطناعي التوليدي»، التي تتطلب من مقدمي الخدمات التسجيل لدى الجهات التنظيمية.

GateNewsمنذ 19 د

Hugging Face 开源 ml-intern:面向自主 ML 研究的 AI 代理

开源的 ml-intern,Hugging Face 的自主 ML 研究代理,会阅读论文、策划数据、训练、评估,并在科学、医学和数学领域持续迭代。 摘要:Hugging Face 的 ml-intern 是一个开源的自主 ML 研究代理:它会阅读论文、整理数据集,在本地或云端 GPU 上训练、评估结果,并迭代改进。它基于 smolagents,并提供 CLI 和网页界面,可在 arXiv/HF Papers、HF Hub 和 HF Jobs 之间导航。演示覆盖科学、医学和数学,展示端到端自动化以及性能提升。

GateNewsمنذ 34 د

JPMorgan Chase ترفع هدفها لنهاية العام لمؤشر S&P 500 إلى 7,600، مستشهدة بطفرة استثمارات الذكاء الاصطناعي وتراجع المخاطر الجيوسياسية

الملخص: رفع JPMorgan مؤشر S&P 500 لعام 2026 إلى 7,600، ولـ2027 إلى 385 ربحًا للسهم، مدفوعًا بحماس الذكاء الاصطناعي وتراجع حدة التوترات في الشرق الأوسط؛ كما يبقى السعر إلى الأرباح المستقبلية عند 22x، مع وجود احتمال لارتفاعه إلى 23x و~8,000 إذا تراجعت التوترات؛ ويحذر من حدوث تماسك قصير الأجل وسط مخاطر النفط والجيوسياسة. النص الموجز: فريق الاستراتيجية لدى JPMorgan، بقيادة Dubravko Lakos-Bujas، رفع توقعات S&P 500 لنهاية العام إلى 7,600 من 7,200، مشيرًا إلى تجدد حماس الذكاء الاصطناعي وتراجع التوترات في الشرق الأوسط. تم تعزيز ربحية السهم لـ2026 إلى $330 وإلى 2027 إلى $385، مع تثبيت المضاعف الآجل عند 22x؛ إذ يمكن أن يؤدي حل أسرع للأوضاع الجيوسياسية إلى رفع المضاعف إلى 23x ودفع 2026 نحو 8,000. اكتسب محور الذكاء الاصطناعي زخمًا بعد أن كشفت Anthropic عن Mythos، حيث حققت نحو ثلثي أسهم S&P 500 المرتبطة بالذكاء الاصطناعي أداءً يفوق السوق. تشمل المخاطر ارتفاع أسعار النفط واستمرار التوترات الجيوسياسية، ما يشير إلى احتمال حدوث تماسك قصير الأجل قبل تحقيق مكاسب إضافية.

GateNewsمنذ 38 د
تعليق
0/400
لا توجد تعليقات