#Deepseek Goes Viral حازت DeepSeek ، وهي شركة ناشئة في مجال الذكاء الاصطناعي مقرها في هانغتشو ، الصين ، على اهتمام كبير في صناعة الذكاء الاصطناعي العالمية بإطلاق نموذج اللغة الكبير DeepSeek-V3 في نهاية ديسمبر 2024. يحتوي هذا النموذج على 671 مليار معلمة ولكنه استغرق حوالي شهرين فقط للتدريب بتكلفة قدرها 5.58 مليون دولار ، وهي أقل بكثير من استثمارات الشركات التكنولوجية الرئيسية الأخرى.
يحقق DeepSeek-V3 أداءًا متفوقًا بين النماذج مفتوحة المصدر ويقارن مع أكثر النماذج المتقدمة في العالم. قامت الشركة بتحسين عملية التدريب لتقليل التكاليف ، باستخدام حوالي 2.78 مليون ساعة GPU مع بطاقات H800 GPUs من Nvi