أطلقت شركة Rakuten "أكبر نموذج ذكاء اصطناعي عالي الأداء في اليابان"، وتوضح ملفات الإعداد الخاصة به أنه مبني على بنية DeepSeek V3

robot
إنشاء الملخص قيد التقدم

أخبار صحيفة أودايلي ستيلر: أطلقت مجموعة لوتي نموذج الذكاء الاصطناعي المفتوح المصدر Rakuten AI 3.0، ووصفتها بأنها “أكبر نموذج ذكاء اصطناعي عالي الأداء في اليابان”. يعتمد النموذج على بنية MoE، ويحتوي على 671 مليار معلمة، ويشغل 37 مليار معلمة في كل استنتاج، ونافذة سياق تبلغ 128 ألف، وتم تحسينه لسيناريوهات اللغة اليابانية، حيث يتفوق على GPT-4o في العديد من الاختبارات المعيارية للغة اليابانية.

يعد هذا النموذج أحد نتائج مشروع GENIAC الذي يقدمه وزارة الاقتصاد والصناعة اليابانية ووكالة تطوير تكنولوجيا الطاقة الجديدة والصناعات (NEDO)، وقد حصل على دعم جزئي من حيث القدرة الحاسوبية. لم تكشف لوتي عن مصدر النموذج الأساسي، واكتفت بالقول إنه مبني على نتائج المجتمع المفتوح المصدر.

وجد المجتمع في ملفات نموذج HuggingFace أن ملف config.json الخاص به يحتوي على “deepseek_v3” وحقول بنية ذات صلة، وأن حجم المعلمات وتكوين السياق يتطابق مع DeepSeek V3، مما يشير إلى أن النموذج أو مبني على DeepSeek V3 مع تعديل لليابانية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت