في الآونة الأخيرة، أصبح الجمع بين النماذج الكبيرة والروبوتات ملفتًا للنظر للغاية، بدءًا من "الذكاء المتجسد" الذي اقترحه فريق البروفيسور لي فيفي من جامعة ستانفورد إلى "الضوء المحلي" لـ Yushu وZhiyuan وغيرها من العلامات التجارية مؤخرًا. في المؤتمر العالمي للروبوت 2023 قبل أيام قليلة، أدت الروبوتات البشرية مهارات مختلفة على الفور، مما حول الخيال العلمي إلى واقع، وقامت العديد من الشركات بنقل منتجاتها المتعلقة بالروبوت إلى مكان الحادث لإظهار مهاراتها. بعد ذلك، أظهرت الإحصائيات أن هناك 160 شركة روبوت محلية وأجنبية مشاركة في المؤتمر، و600 روبوت، من بينها الروبوتات البشرية الأكثر شعبية. سافر مؤسس بوسطن ديناميكس الشهير، مارك رايبرت، وعالم الروبوتات الياباني الشهير هيروشي إيشيجورو، آلاف الأميال لحضور المؤتمر.
ليس هناك شك في أن الروبوتات التي تشبه البشر أصبحت نقطة ساخنة جديدة في سوق رأس المال. في السوق الأولية، تقوم شركات BV Baidu Ventures، وJingwei، وHillhouse، وGaorong، وZhenge، بالبحث بنشاط على الخط الأمامي. ويشعر أصحاب رأس المال الاستثماري الذين تحدثوا عن النماذج الكبيرة في النصف الأول من العام بالقلق الآن بشأن الروبوتات العالمية. في السوق الثانوية، تم الترويج لأسهم مفهوم الروبوتات البشرية لعدة موجات. في مايو/أيار، أدت تصريحات ماسك بشكل مباشر إلى ارتفاع موجة مفهوم الروبوت "Saimo Smart" من الفئة A إلى الحد اليومي. كما ارتفعت أسهم "Fengli Smart" بأكثر من 150% في غضون ستة أيام تداول، حتى أنها جذبت انتباه بورصة شنتشن. البورصة: لا بد من توضيح سبب وعقلانية الارتفاع الكبير في سعر السهم.
دفع تيسلا
في اجتماع المساهمين في Tesla لهذا العام، قال ماسك: "لقد عزز الروبوت الآلي أوبتيموس بشكل كبير التحكم في الحركة والقوة، بالإضافة إلى الإدراك البيئي، وتتكرر التكنولوجيا بسرعة. ** تشير التقديرات إلى أن الطلب على الروبوتات في "قد يصل عدد البشر في المستقبل إلى 10 مليارات، أو حتى أكثر. إذا تم حساب نسبة البشر والروبوتات على أنها 2:1، فقد يكون الطلب على الروبوتات البشرية أكبر بكثير من الطلب على السيارات الكهربائية.**" بهذه الكلمات القليلة، زادت ثقة " ماسك ". وسرعان ما أشعل الحماس والتفاني شعلة مسار الروبوتات البشرية، واشتداد هذا الاتجاه حتى يومنا هذا. ومن منظور التطبيق العملي، قد تكون تسلا أيضًا هي التي تعزز نضج وكمال السلسلة الصناعية بأكملها.
ظهر روبوت تسلا أوبتيموس لأول مرة في الحدث الرسمي ليوم الذكاء الاصطناعي لعام 2022 العام الماضي، وأكمل المشي المستقل والالتفاف والتوقف والتلويح وغيرها من الإجراءات على الفور. تتوافق معظم تقنيات Optimus مع تلك الخاصة بمركبات Tesla، مثل الرؤية الآلية، و"الدماغ" الذي يعالج البيانات المرئية، ويتخذ قرارات العمل، ويدعم الاتصال، والأهم من ذلك، أنه يتوافق مع مركبات Tesla. كما أنها مجهزة بنفس كمبيوتر FSD الموجود في سيارة تسلا وتقنية الشبكة العصبية المتعلقة بالطيار الآلي، ومن المتوقع ألا يتجاوز السعر النهائي 20 ألف دولار أمريكي، أي حوالي 144 ألف يوان.
** من منظور التكنولوجيا العملية، تتمتع شركات مثل تيسلا بمزايا متأصلة في صنع الروبوتات، لأن العديد من المبادئ الأساسية للروبوتات والذكاء الاصطناعي متماثلة، ويمكن أيضًا اعتبارها امتدادًا طبيعيًا للسيارات الكهربائية، ويمكن أن تعتبر المركبات الكهربائية الجيل الأول من الروبوتات ذات العجلات الأربع**. قبل عامين، عندما اقترح ماسك صنع روبوت، أثار الكثير من السخرية لأنه "لا يقوم بالأعمال بشكل صحيح"، ومع ذلك، في بداية هذا العام، كانت رؤية شركة Li Auto هي أن تصبح أفضل شركة للذكاء الاصطناعي والروبوتات. ليست أكبر شركة للسيارات الكهربائية في العالم. ويمكن ملاحظة أن الأحلام سوف تنتشر أيضًا.
اتجاهات جديدة للروبوتات
الروبوتات ليست شائعة الآن. إن القدرة على تعميم المهام هي التي تحدد المدى الذي يمكن أن يصل إليه الروبوت البشري. وهذا أيضًا هو الاتجاه الذي تبذله العديد من الشركات. "الأضواء المحلية" مثل Yushu و Zhiyuan التي تم ذكرها من قبل لن تتكرر هنا. هناك شركات ناشئة أخرى تستحق الاهتمام أيضًا، مثل Yuequan Bionics. إن براعة منتجاتها الروبوتية قابلة للمقارنة بالفعل مع تلك. من أيدي البشر. يمكن تعديل اليد الذكية الإلكترونية الشبيهة بالإنسان التي طورتها الشركة بشكل مستقل من خلال الحركة النشطة والثني والقلب وغيرها من الإجراءات تحت تدخل خارجي لمنع الجسم الممسك من السقوط. الوصف الرسمي لها هو: "بالإضافة إلى الإمساك والضغط وغيرها من الإجراءات، يمكنك أيضًا إكمال 27 عملية يدوية مختلفة معقدة ودقيقة، مثل استخدام عيدان تناول الطعام لالتقاط الأشياء الصغيرة، وتطبيق منتجات العناية بالبشرة، وتقليب القهوة، والمسح الهواتف المحمولة، وفتح الأزرار، وما إلى ذلك." تتبنى اليد البارعة تقنية القيادة لجسم التوتر والضغط، الذي يتمتع بدرجة عالية جدًا من الحرية. وفي الوقت نفسه، تم دمج مستشعر مرن مع ارتجاع عصبي ملموس.
وبالإضافة إلى ذلك، هناك الروبوت "Wukong-4" من فريق الروبوتات بكلية التحكم بجامعة تشجيانغ، وبحسب التقارير، يمكن لـ "Wukong-4" التكيف مع التضاريس المختلفة مثل الطرق الخارجية والعشب والطرق الموحلة. ، وأسرع سرعة أمامية يمكن أن تصل إلى 6 كيلومترات في الساعة، ويمكنه أيضًا القفز على ارتفاع 0.5 متر، ويمكنه أيضًا المرور صعودًا وهبوطًا على منحدرات بزاوية 25 درجة وخطوات بارتفاع 10 سم. في ظل الاضطرابات غير المعروفة مثل أسطح الطرق الزلقة واضطرابات الدفع الخارجية، يمكنه استعادة التوازن بسرعة والحفاظ على المشي المستقر. يحقق "Wukong-4" بناء خريطة البيئة ثلاثية الأبعاد للروبوت والملاحة الديناميكية المستقلة من خلال دمج تقنية حركة الساق والقدم وتكنولوجيا الإدراك البيئي.
خلف هذه الروبوتات الجديدة توجد سلسلة من تقنيات البرامج والأجهزة التي تم تطويرها بشكل مستقل من قبل المؤسسات والجامعات: أجسام روبوتية بشرية تعتمد على محركات التحسس، ومفاصل وحدات ذات كثافة عزم دوران عالية مطورة ذاتيًا وتصميم هيكلي متكامل، وسبائك عالية القوة وألياف الكربون ومواد متقدمة. مثل البلاستيك الهندسي يحتفظ بالمظهر الجميل ويحسن قوة واستقرار الهيكل؛ إلى جانب نموذج اللغة الكبير وخوارزمية التحكم المتقدمة في القوة، فإنه يتمتع بأداء ديناميكي عالي ويمكنه فهم البشر بشكل أفضل.
من ملاحقة المستثمرين، ودخول شركات التكنولوجيا الرائدة، إلى الأبحاث المبتكرة للشركات الناشئة والجامعات، تتقدم الروبوتات البشرية في العديد من الاتجاهات وتبشر بمرحلة جديدة من التطوير. على سبيل المثال، يعد دمج نموذج كبير وتزويده بالدماغ متغيرًا تقنيًا رئيسيًا آخر يدفع صعود الروبوتات البشرية.
وكما قلت من قبل فإن "الذكاء المتجسد" هو "جسم ذكي له جسم حقيقي ويدعم التفاعل الجسدي"، وهو ما يعادل إضافة جسد إلى الذكاء الاصطناعي، وهو ما ينتمي إلى مسار تطوير جديد للروبوتات ذات الأغراض العامة. وسوف يضيف رأس المال المزيد من الحطب إلى الصناعة. وبعد خمس إلى عشر سنوات من الاستثمار على نطاق واسع، سوف يحرق بقوة أكبر، ويحقق أخيرا تسويق الروبوتات ذات الأغراض العامة. ** لفترة طويلة في الماضي، كان تطوير الروبوتات يقتصر على نوع معين من العمل، تمامًا مثل الذكاء الاصطناعي، الذي كان محدودًا بنفس القدر في السابق. تم تطوير النموذج الكبير تدريجيًا إلى AGI، ويمكن أن يؤدي الجمع مع الروبوت إلى توسيع نطاق تطبيق الروبوت بشكل طبيعي. **
مقارنة بالصين، يعد التقدم في الخارج أسرع بخطوة واحدة، وقد تمت ترقية قدرة النموذج الكبير من اللغة إلى طبقة التنفيذ. وفي يوليو/تموز، تمكنت الروبوتات التابعة لفريق لي فيفي من سحب الأدراج، وفك أغطية الزجاجات، ووزن التفاح. واصل Robotics Transformer 2 (RT-2) الذي أطلقته شركة Google DeepMind في نهاية الشهر، إجراء بحث متعمق في نفس الاتجاه. RT-2 هو نموذج رؤية + لغة + إجراء (VLA) جديد تمامًا يمكنه التعلم من بيانات الشبكة والروبوت وترجمة هذه المعرفة إلى تعليمات عامة للتحكم في الروبوت. أظهر RT-2 تعميمًا أفضل وفهمًا يتجاوز المجالات الدلالية والمرئية للبيانات الآلية التي تعرض لها، وكان قادرًا على تفسير التعليمات الجديدة والاستجابة للأوامر من خلال إجراء التفكير الأساسي.
** محكوم عليها أن تكون طريقا وعر **
وكما يقول المثل، "المثل العليا ممتلئة، ولكن الواقع هزيل". وبينما تعمل الروبوتات والذكاء الاصطناعي على تسريع وتيرة تطورها، لا يزال هناك العديد من التحديات التقنية والتجارية العملية. يقال أن مجال الروبوتات العامة يحتاج أيضًا إلى تقنيات أو منتجات مثل GPT-4 من أجل الجمع بين القدرات متعددة الوسائط وتوحيد تطوير الذكاء المتجسد حقًا. ولكن هذه ليست مهمة سهلة. فالجمع بين الروبوتات والنماذج الكبيرة الموضحة في الأوراق الحالية وبعض العروض التوضيحية لا يزال يركز على حل مشاكل التفاعل، ولكن هذا لا يعني أن الروبوتات يمكن أن تصبح روبوتات ذات أغراض عامة بعد حل مشاكل التفاعل. من منظور تطوير الروبوتات، يساهم النموذج الكبير بالفعل ولكن تأثيره محدود على التحكم الأساسي والتنفيذ. في الوقت الحاضر، يتبنى المجتمع الأكاديمي أساليب تعتمد على الذكاء الاصطناعي، ويأمل بشكل عام في استخدام طريقة التعلم المعزز كتنفيذ للتحكم الأساسي، ولكن هذا ليس له علاقة مباشرة بالنموذج الكبير، وطرق التحكم في التعلم المعزز ليست ناضجة، وأغلبها ما زال في مرحلة البحث الأكاديمي..
تكمن صعوبة أخرى في التطور المشترك لقدرات البرامج والأجهزة. على الرغم من أن الكثير من الناس يعتقدون أن الجمع بين النماذج الكبيرة والروبوتات سيجلب فرصًا مذهلة، إلا أن مارك رايبرت، مؤسس شركة بوسطن ديناميكس، قال إن هندسة الأجهزة والبرمجيات لهما نفس القدر من الأهمية في تطوير الروبوتات في المستقبل. "يعتقد بعض الناس أن البرمجيات يمكنها التغلب على جميع المشاكل والقيود المفروضة على الأجهزة. وأنا لا أتفق مع هذا الرأي. فقط أفضل مصممي الأجهزة ومصممي البرمجيات يعملون معًا لتصميم أفضل الروبوتات في العالم."
بالإضافة إلى ذلك، يجب تحسين الأمان. قد لا يكون لـ "وهم الذكاء الاصطناعي" للنموذج الضخم أي تأثير كبير، ولكن بمجرد دخوله إلى الحياة، تحتاج الروبوتات إلى ضمان الدقة والسلامة. وهذه هي الاتجاهات التي تحتاج التكنولوجيا إلى تحسينها. التكنولوجيا والسيناريوهات والتكاليف والسلامة والفرص والتحديات تأتي في نفس الوقت، وتتخذ الروبوتات البشرية خطوة حاسمة نحو المستقبل.
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
نموذج كبير + روبوت بشري، هل هو الاتجاه التالي؟
في الآونة الأخيرة، أصبح الجمع بين النماذج الكبيرة والروبوتات ملفتًا للنظر للغاية، بدءًا من "الذكاء المتجسد" الذي اقترحه فريق البروفيسور لي فيفي من جامعة ستانفورد إلى "الضوء المحلي" لـ Yushu وZhiyuan وغيرها من العلامات التجارية مؤخرًا. في المؤتمر العالمي للروبوت 2023 قبل أيام قليلة، أدت الروبوتات البشرية مهارات مختلفة على الفور، مما حول الخيال العلمي إلى واقع، وقامت العديد من الشركات بنقل منتجاتها المتعلقة بالروبوت إلى مكان الحادث لإظهار مهاراتها. بعد ذلك، أظهرت الإحصائيات أن هناك 160 شركة روبوت محلية وأجنبية مشاركة في المؤتمر، و600 روبوت، من بينها الروبوتات البشرية الأكثر شعبية. سافر مؤسس بوسطن ديناميكس الشهير، مارك رايبرت، وعالم الروبوتات الياباني الشهير هيروشي إيشيجورو، آلاف الأميال لحضور المؤتمر.
ليس هناك شك في أن الروبوتات التي تشبه البشر أصبحت نقطة ساخنة جديدة في سوق رأس المال. في السوق الأولية، تقوم شركات BV Baidu Ventures، وJingwei، وHillhouse، وGaorong، وZhenge، بالبحث بنشاط على الخط الأمامي. ويشعر أصحاب رأس المال الاستثماري الذين تحدثوا عن النماذج الكبيرة في النصف الأول من العام بالقلق الآن بشأن الروبوتات العالمية. في السوق الثانوية، تم الترويج لأسهم مفهوم الروبوتات البشرية لعدة موجات. في مايو/أيار، أدت تصريحات ماسك بشكل مباشر إلى ارتفاع موجة مفهوم الروبوت "Saimo Smart" من الفئة A إلى الحد اليومي. كما ارتفعت أسهم "Fengli Smart" بأكثر من 150% في غضون ستة أيام تداول، حتى أنها جذبت انتباه بورصة شنتشن. البورصة: لا بد من توضيح سبب وعقلانية الارتفاع الكبير في سعر السهم.
دفع تيسلا
في اجتماع المساهمين في Tesla لهذا العام، قال ماسك: "لقد عزز الروبوت الآلي أوبتيموس بشكل كبير التحكم في الحركة والقوة، بالإضافة إلى الإدراك البيئي، وتتكرر التكنولوجيا بسرعة. ** تشير التقديرات إلى أن الطلب على الروبوتات في "قد يصل عدد البشر في المستقبل إلى 10 مليارات، أو حتى أكثر. إذا تم حساب نسبة البشر والروبوتات على أنها 2:1، فقد يكون الطلب على الروبوتات البشرية أكبر بكثير من الطلب على السيارات الكهربائية.**" بهذه الكلمات القليلة، زادت ثقة " ماسك ". وسرعان ما أشعل الحماس والتفاني شعلة مسار الروبوتات البشرية، واشتداد هذا الاتجاه حتى يومنا هذا. ومن منظور التطبيق العملي، قد تكون تسلا أيضًا هي التي تعزز نضج وكمال السلسلة الصناعية بأكملها.
ظهر روبوت تسلا أوبتيموس لأول مرة في الحدث الرسمي ليوم الذكاء الاصطناعي لعام 2022 العام الماضي، وأكمل المشي المستقل والالتفاف والتوقف والتلويح وغيرها من الإجراءات على الفور. تتوافق معظم تقنيات Optimus مع تلك الخاصة بمركبات Tesla، مثل الرؤية الآلية، و"الدماغ" الذي يعالج البيانات المرئية، ويتخذ قرارات العمل، ويدعم الاتصال، والأهم من ذلك، أنه يتوافق مع مركبات Tesla. كما أنها مجهزة بنفس كمبيوتر FSD الموجود في سيارة تسلا وتقنية الشبكة العصبية المتعلقة بالطيار الآلي، ومن المتوقع ألا يتجاوز السعر النهائي 20 ألف دولار أمريكي، أي حوالي 144 ألف يوان.
اتجاهات جديدة للروبوتات
الروبوتات ليست شائعة الآن. إن القدرة على تعميم المهام هي التي تحدد المدى الذي يمكن أن يصل إليه الروبوت البشري. وهذا أيضًا هو الاتجاه الذي تبذله العديد من الشركات. "الأضواء المحلية" مثل Yushu و Zhiyuan التي تم ذكرها من قبل لن تتكرر هنا. هناك شركات ناشئة أخرى تستحق الاهتمام أيضًا، مثل Yuequan Bionics. إن براعة منتجاتها الروبوتية قابلة للمقارنة بالفعل مع تلك. من أيدي البشر. يمكن تعديل اليد الذكية الإلكترونية الشبيهة بالإنسان التي طورتها الشركة بشكل مستقل من خلال الحركة النشطة والثني والقلب وغيرها من الإجراءات تحت تدخل خارجي لمنع الجسم الممسك من السقوط. الوصف الرسمي لها هو: "بالإضافة إلى الإمساك والضغط وغيرها من الإجراءات، يمكنك أيضًا إكمال 27 عملية يدوية مختلفة معقدة ودقيقة، مثل استخدام عيدان تناول الطعام لالتقاط الأشياء الصغيرة، وتطبيق منتجات العناية بالبشرة، وتقليب القهوة، والمسح الهواتف المحمولة، وفتح الأزرار، وما إلى ذلك." تتبنى اليد البارعة تقنية القيادة لجسم التوتر والضغط، الذي يتمتع بدرجة عالية جدًا من الحرية. وفي الوقت نفسه، تم دمج مستشعر مرن مع ارتجاع عصبي ملموس.
من ملاحقة المستثمرين، ودخول شركات التكنولوجيا الرائدة، إلى الأبحاث المبتكرة للشركات الناشئة والجامعات، تتقدم الروبوتات البشرية في العديد من الاتجاهات وتبشر بمرحلة جديدة من التطوير. على سبيل المثال، يعد دمج نموذج كبير وتزويده بالدماغ متغيرًا تقنيًا رئيسيًا آخر يدفع صعود الروبوتات البشرية.
وكما قلت من قبل فإن "الذكاء المتجسد" هو "جسم ذكي له جسم حقيقي ويدعم التفاعل الجسدي"، وهو ما يعادل إضافة جسد إلى الذكاء الاصطناعي، وهو ما ينتمي إلى مسار تطوير جديد للروبوتات ذات الأغراض العامة. وسوف يضيف رأس المال المزيد من الحطب إلى الصناعة. وبعد خمس إلى عشر سنوات من الاستثمار على نطاق واسع، سوف يحرق بقوة أكبر، ويحقق أخيرا تسويق الروبوتات ذات الأغراض العامة. ** لفترة طويلة في الماضي، كان تطوير الروبوتات يقتصر على نوع معين من العمل، تمامًا مثل الذكاء الاصطناعي، الذي كان محدودًا بنفس القدر في السابق. تم تطوير النموذج الكبير تدريجيًا إلى AGI، ويمكن أن يؤدي الجمع مع الروبوت إلى توسيع نطاق تطبيق الروبوت بشكل طبيعي. **
مقارنة بالصين، يعد التقدم في الخارج أسرع بخطوة واحدة، وقد تمت ترقية قدرة النموذج الكبير من اللغة إلى طبقة التنفيذ. وفي يوليو/تموز، تمكنت الروبوتات التابعة لفريق لي فيفي من سحب الأدراج، وفك أغطية الزجاجات، ووزن التفاح. واصل Robotics Transformer 2 (RT-2) الذي أطلقته شركة Google DeepMind في نهاية الشهر، إجراء بحث متعمق في نفس الاتجاه. RT-2 هو نموذج رؤية + لغة + إجراء (VLA) جديد تمامًا يمكنه التعلم من بيانات الشبكة والروبوت وترجمة هذه المعرفة إلى تعليمات عامة للتحكم في الروبوت. أظهر RT-2 تعميمًا أفضل وفهمًا يتجاوز المجالات الدلالية والمرئية للبيانات الآلية التي تعرض لها، وكان قادرًا على تفسير التعليمات الجديدة والاستجابة للأوامر من خلال إجراء التفكير الأساسي.
** محكوم عليها أن تكون طريقا وعر **
وكما يقول المثل، "المثل العليا ممتلئة، ولكن الواقع هزيل". وبينما تعمل الروبوتات والذكاء الاصطناعي على تسريع وتيرة تطورها، لا يزال هناك العديد من التحديات التقنية والتجارية العملية. يقال أن مجال الروبوتات العامة يحتاج أيضًا إلى تقنيات أو منتجات مثل GPT-4 من أجل الجمع بين القدرات متعددة الوسائط وتوحيد تطوير الذكاء المتجسد حقًا. ولكن هذه ليست مهمة سهلة. فالجمع بين الروبوتات والنماذج الكبيرة الموضحة في الأوراق الحالية وبعض العروض التوضيحية لا يزال يركز على حل مشاكل التفاعل، ولكن هذا لا يعني أن الروبوتات يمكن أن تصبح روبوتات ذات أغراض عامة بعد حل مشاكل التفاعل. من منظور تطوير الروبوتات، يساهم النموذج الكبير بالفعل ولكن تأثيره محدود على التحكم الأساسي والتنفيذ. في الوقت الحاضر، يتبنى المجتمع الأكاديمي أساليب تعتمد على الذكاء الاصطناعي، ويأمل بشكل عام في استخدام طريقة التعلم المعزز كتنفيذ للتحكم الأساسي، ولكن هذا ليس له علاقة مباشرة بالنموذج الكبير، وطرق التحكم في التعلم المعزز ليست ناضجة، وأغلبها ما زال في مرحلة البحث الأكاديمي..
بالإضافة إلى ذلك، يجب تحسين الأمان. قد لا يكون لـ "وهم الذكاء الاصطناعي" للنموذج الضخم أي تأثير كبير، ولكن بمجرد دخوله إلى الحياة، تحتاج الروبوتات إلى ضمان الدقة والسلامة. وهذه هي الاتجاهات التي تحتاج التكنولوجيا إلى تحسينها. التكنولوجيا والسيناريوهات والتكاليف والسلامة والفرص والتحديات تأتي في نفس الوقت، وتتخذ الروبوتات البشرية خطوة حاسمة نحو المستقبل.