ما قبل إصدار V4 من DeepSeek: السمات، التنظيم والأهداف الفريدة لليانغ وينفينغ

يمر DeepSeek حاليًا بمرحلة انتقالية دقيقة؛ فمنذ النصف الثاني من عام 2025 وحتى الآن، غادر بعض أعضاء DeepSeek ووجدوا وجهات جديدة، وهم:

  • وانغ بينغشوان، الذي استقطبته تينسنت مطلع العام الفائت (مطلع ﻧﯾانغ شونيو)، وهو المؤلف الأساسي لـ DeepSeek LLM (النموذج اللغوي الكبير الأول من DeepSeek)، ومنذ ذلك الحين شارك في تدريب النماذج عبر الأجيال.

  • ويي هاوران، الذي يُرجّح أنه غادر حوالي عيد الربيع؛ وهو المؤلف الأساسي لسلسلة DeepSeek-OCR، وقد يلتحق بواحدة من كبريات الشركات.

  • وجو دايا، الذي استقال رسميًا مؤخرًا؛ وهو المؤلف الأساسي لـ DeepSeek-R1، وقد يلتحق أيضًا بواحدة من كبريات الشركات.

  • وآنغلى تشونغ، الذي غادر في وقت مبكر من عام 2025 ودخل حالة التقاعد؛ وفي شهر يناير من هذا العام أعلن رسميًا انضمامه إلى شركة ناشئة للقيادة الذاتية تُدعى يوان رونغ تشي شينغ (元戎启行)؛ وآه تشونغ هو عضو قديم انضم منذ فترة هوان فانغ، وهو أيضًا المساهم الأساسي في نتائج DeepSeek متعددة الوسائط مثل Janus-Pro.

لم يكن لدى DeepSeek تمويل سابقًا، ولا توجد قيمة تقييم شركة مؤكدة. وعندما تتصاعد القيمة السوقية أو التقييمات لدى شركات ذكاء اصطناعي أخرى، كان ليانغ ونفِنغ يفكر في كيفية الرد على أسئلة أعضاء الفريق: كم تبلغ قيمة الشركة فعليًا؟ هذا يرتبط مباشرةً بالقيمة الفعلية لخيارات الأسهم (الخيارات) التي وُقّع عليها الموظفون.

منذ خريف 2025، بدأ ليانغ ونفِنغ أيضًا يطرح بشكل متزايد موضوع تحويل المنتجات إلى واقع عملي والتوسع في الجانب التجاري. لدى DeepSeek فريق منتجات يضم عشرات الأشخاص بالفعل، لكنهم لم يدخلوا بعد في اتجاهات تطبيقات رائجة مثل برمجة الذكاء الاصطناعي و”العملاء العامّين” (General Agent)؛ وعلى مستوى المستخدمين النهائيين (C-end) ما يزال لديهم فقط منتج chatbot نموذجي.

ولا تزال دورة ليانغ ونفِنغ تشمل قضية إدارة حجم الفريق. لقد تجاوز عدد موظفي DeepSeek عدد هوان فانغ، وهو أكبر تنظيم تولّى إدارته.

تغطي التغييرات المتعددة أعلاه حالة واحدة: لم يتم إصدار DeepSeek V4 رسميًا بعد.

في الواقع، حوالي يناير 2026، تم تزويد نسخة صغيرة المعلمات من V4 لبعض مجتمعات الأطر مفتوحة المصدر لتبدأ أعمال التكييف. وبحسب التوقعات السابقة الأكثر تفاؤلًا، كان من المحتمل أن يُصدر إصدار المعلمات الكبيرة من V4 حول منتصف فبراير، قبل عيد الربيع أو بعده مباشرة، ويُتاح كمصدر مفتوح. وبحسب ما يُفهم، قد يتم إصدار DeepSeek V4 في شهر أبريل.

يغادر بعض الأشخاص، ويختار المزيد البقاء. يواصل DeepSeek إجراء التعديلات، لكن هناك أيضًا سمات عديدة لم تتغير.

إنه مختبر ذكاء اصطناعي “لا يرهق نفسه بالتنافس” (لا ينخرط في سباق سبُق) وهو استثناء عالميًا تقريبًا. عندما يعمل المطورون الرئيسيون في شركات الذكاء الاصطناعي في الصين والولايات المتحدة مثل Google وOpenAI وxAI وByteDance بما يصل إلى 70~80 ساعة أسبوعيًا، يخرج معظم موظفي DeepSeek عادةً من الشركة حوالي الساعة 6 مساءً إلى 7 مساءً، ولا يحضرون بالدوام الصباحي (لا يلتزمون بالنداءات/التحقق من الحضور).

يعتقد ليانغ ونفِنغ أن وقت الإنتاج عالي الجودة الذي يستطيع شخص واحد تقديمه في يوم واحد يصعب أن يتجاوز 6~8 ساعات.

لا يوجد لدى DeepSeek تقييم أداء واضح ولا DDL (موعد نهائي). وما زال هذا التنظيم الصغير، الذي يتميز بكثافة عالية من المواهب، يستمر في نمط “التقسيم الطبيعي للعمل”: يمكن للباحثين تكوين فرق بشكل حر أو البحث منفردين في أفكار جديدة.

“بالإضافة إلى الخط الرئيسي، يوجد أيضًا أشخاص يقومون بأبحاث طويلة الأمد قد لا تحقق نتائج حتى بعد عام.” “DeepSeek هو مكان يضم أشخاصًا يريدون حقًا إجراء أبحاث؛ وفي الصين، بل وحتى على مستوى العالم، يمكن العثور على أفضل مكان لهم.” قال أشخاص قريبون من DeepSeek.

بالطبع، لدى DeepSeek أيضًا سمة أخرى: الغموض. وبالخصوص بعد عام 2025، باستثناء التقارير التقنية التي يتم نشرها علنًا، يصير من الصعب سماع أصواتهم: بدءًا من المؤسس ليانغ ونفِنغ وحتى أعضاء الفريق الذين “يصمتون جماعيًا”. وفي وسائل التواصل الاجتماعي أو المجتمعات التي ينشط فيها العاملون في مجال الذكاء الاصطناعي، لا يُسمع منهم كثير.

في هذا التقرير، نعرض سمات DeepSeek، ومواضع تركيز العمل، وطريقة تشغيل التنظيم، التي تعرفنا عليها عبر مختلف القنوات، والتغيرات التي تحدث لهذا التنظيم الذي لا يتجاوز 200 شخص. وكل ذلك ينبع من الهدف الفريد الذي وضعه ليانغ ونفِنغ لـ DeepSeek.

ليانغ ونفِنغ: يعمل قليلًا من الأمور، لكنه يصل بها إلى أقصى حد

يعود هدف ليانغ ونفِنغ في مجال الذكاء الاصطناعي إلى وقت أبكر بكثير من تأسيس DeepSeek في 2023.

في عام 2016، قام هاسابيس، مؤسس DeepMind وصاحب طرح AGI (المقترح بوجود ذكاء اصطناعي عام)، بتأسيس فريق للتداول الكمي، في محاولة لكسب الإيرادات لـ DeepMind في ذلك الوقت حين كان البعض يفكر بالانفصال عن Google. لكن المحاولة لم تُحقق ربحًا.

وفي العام نفسه، كان ليانغ ونفِنغ، الخريج من جامعة تشجيانغ (بكالوريوس وماجستير)، قد عمل في الاستثمار الكمي لمدة 8 سنوات. فقد أسس “هوان فانغ” (幻方) في 2015، وبدأ تشغيل التعلم العميق على وحدات GPU للتداول الفعلي منذ 2016، وحقق في أواخر 2017 “تقريبًا تحويل معظم استراتيجيات التداول إلى ذكاء اصطناعي”، ثم بدأ في 2019 بناء أول مجموعة قوة حوسبة في هوان فانغ، والمعروفة باسم “إطفاء رقم 1” (萤火 1号) وبها 1100 بطاقة GPU.

وفي عام 2019 أيضًا، تأسست رسميًا شركة هوان فانغ للذكاء الاصطناعي (幻方人工智能基础研究有限公司). والآن، كلٌّ من لو فو لِي التي تشرف على الذكاء الاصطناعي في Xiaomi، وكذلك آنغ فنغ لانغ (阮翀)، الذي انضم مؤخرًا إلى يوان رونغ، كانا قد انضما إلى هوان فانغ بعد ذلك، ثم انتقلا لاحقًا إلى DeepSeek في 2023.

وبصفته شخصًا تحرّر من القيود المالية قبل الثلاثين تقريبًا، تبدو حياة ليانغ ونفِنغ بسيطة وغامضة.

بحسب انطباع من حوله، كان يرتدي نفس الملابس لأيام عديدة. وفي هانغتشو، كان يقيم لفترة طويلة في الفنادق، بينما في بكين حيث يقيم معظم مطوري DeepSeek يستأجر شققًا. جسمه نحيف، لديه عادة ممارسة الرياضة، ومن هواياته المعروفة المشي لمسافات طويلة وغيرها من الأنشطة الخارجية.

كان هوانغ رين-شون (黄仁勋) يدعو موظفي إنفيديا لزيارة منزله، يشربون مشروبات صغيرة ويتبادلون الحديث عن الحياة اليومية، ويفصح عن حبه للسيارات الرياضية بشكل بهيج. أما ليانغ ونفِنغ فلا يشارك في أنشطة بناء الفريق على مستوى الربع، ولا يلتقي الأعضاء على مآدب مجتمعين بشكل متكرر، وحتى في نشاط بناء الفريق الكبير في نهاية العام يظهر فقط أثناء خطابه ولا يشارك طوال الوقت.

في عام 2022، قامت إحدى موظفات هوان فانغ (“خنزير صغير عادي”) بالتبرع شخصيًا لمؤسسة خيرية بمبلغ 1.38 مليار يوان. لاحقًا، افترض كثيرون أن هذا الخنزير الصغير هو ليانغ ونفِنغ. وكانت إجابة موظفي هوان فانغ: “تبرعات الموظفين تكون جميعها مجهولة الهوية، والشركة من الداخل أيضًا لا تعرف الهوية الحقيقية للخنزير”.

ضمن نطاق العمل، ينجز ليانغ ونفِنغ أمورًا قليلة فقط. فهو لا يفعل بعض ما يفعله الرؤساء التنفيذيون لكثير من الشركات الناشئة، مثل جمع التمويل.

في عام 2023، قابل ليانغ ونفِنغ عددًا صغيرًا من المستثمرين. لكن وفقًا لما نعرفه، وضع شرطًا غير مألوف: مثل اتفاقيات الاستثمار بين OpenAI وMicrosoft، أراد ليانغ ونفِنغ من المستثمرين قبول سقف للعائد. خلال هذه الجولة من اللقاءات، لم تقم أي مؤسسة باستثمار في DeepSeek.

بعد ذلك العامين، اجتاح تمويل نماذج الذكاء الاصطناعي في الصين موجة قوية، مع صفقات تُبرم بمبالغ تصل إلى مئات الملايين أو حتى مليارات. لكن ليانغ ونفِنغ لم يعد يلتقي المستثمرين، بل ولم يقم بإنشاء علاقات جديدة. وحتى في حال لم يكن هناك نافذة تمويل، فإن أغلب المؤسسين لا يرفضون عادةً التعرف على شركاء المؤسسات في الصف الأول، إلا أن ليانغ ونفِنغ رفض معظم هذه الطلبات.

وضع ليانغ ونفِنغ تقريبًا كل وقته في الأمور القليلة التي يعتقد أنها يجب أن تكون محور التركيز، فكان دقيقًا وواصلًا بها إلى أقصى حد.

ومن بين مفاتيح نجاح DeepSeek سابقًا كان “توحيد القوة في نقطة واحدة”؛ إذ تم تحديد أن أولوية أعلى تُمنح للنماذج اللغوية الكبيرة، ولم يتم تنفيذ اتجاهات رائجة مثل توليد متعدد الوسائط (multi-modal).

ضمن المسار الرئيسي الذي تم اختياره، سيتخذ ليانغ ونفِنغ نهج “hands on” بالتوغل في التفاصيل. يتعلم من أعضاء الفرق الذين لديهم خلفيات مختلفة معارف حول الخوارزميات والبنية التحتية (Architecture) والبنية التحتية للحوسبة (Infra) والبيانات، وقد يشارك هو نفسه في مناقشات تفاصيل النماذج والمنتجات.

يذكر الكثير ممن التقوا ليانغ ونفِنغ أن لديه “لا هالة مدير تنفيذي” ولا ما يسمى بـ “هالة العبقري”، بل يشبه أكثر باحثًا؛ في حديثه مع الآخرين تكون المواضيع الأكثر اهتمامًا لديه هي المسائل التقنية المحددة.

شارك المؤسس والشريك في Oasis Capital، تشانغ جين-جيان (张津剑)، قصة صغيرة في كتابه/مقاله《那些活出来的人中》، حيث سأل نفسه عن استثماره في مؤسس MiniMax، يان جون-جي (闫俊杰): “هل يوجد شخص أكثر انشغالًا وتركيزًا منك؟” فقال يان جون-جي إنه في مرةٍ ما التقى بصديق لم يكن قد قابله من قبل لتناول طعام؛ لكنه وصل مبكرًا ورأى شخصًا يرتدي تيشيرتًا، فظن أنه مساعد. لم يقدم نفسه في البداية، ثم طرح على يان الكثير من الأسئلة التقنية. وبعد نصف ساعة، قال يان: “متى يأتي السيد ليانغ؟” فرد الشخص: “أنا ليانغ ونفِنغ”.

تنظيم DeepSeek: أفقي، تقسيم مهام متداخل، بلا عمل لساعات إضافية

وبما يتماشى مع أسلوب ليانغ ونفِنغ، فإن تنظيم DeepSeek شديد الأفقية: تتداخل مهام كل مرحلة مع غيرها، ويتخذون حذرًا في التوسع بالحجم، ولا يعملون لساعات إضافية.

عندما أنشأ هوان فانغ، كان لدى ليانغ ونفِنغ شركاء. أما DeepSeek فلا يوجد فيه نائب مسؤول (لا “صاحب منصب ثانٍ”). وبالأخص في فريق الأبحاث، توجد فقط مستويان: ليانغ ونفِنغ وباقي الباحثين. ويتحمل ليانغ ونفِنغ القرارات الكبرى، ويكون صاحب أكبر حصيلة للنتائج.

أما فريق البحث هذا في الوقت الحالي فيضم نحو 100 شخص أو أكثر. وهو يشبه مختبرًا كبيرًا. يميل الباحثون في DeepSeek، المولودون غالبًا في حدود 2000 وما حولها، إلى مخاطبة ليانغ ونفِنغ، المولود في 1985، بلقب “مدير ليانغ” (梁老板). هذا المدير يشبه أكثر المشرف/المرشد: يدير تطوير الأبحاث والتنسيق وتخصيص الموارد، كما يقوم هو نفسه بدراسة بحثية ملموسة؛ ويأتي اسمه ضمن المؤلفين المشاركين في النتائج المشتركة بصفة “المراسل” (Communications author/commuincation author).

أكثر ما يشارك فيه ليانغ ونفِنغ هو فريق بنية النموذج الأساسي (基模架构). بعد مناقشات معمقة مع الفريق، يحددون نسخة البنية المعمارية لكل جيل من النماذج الأساسية. يضم هذا الفريق عددًا يقارب عدة عشرات من الأشخاص، وهم القوة الرئيسية في التدريب قبل التكييف (pretraining).

والوثيق الصلة ببنية النموذج الأساسي هو فريق الـ Infra وفريق البيانات، وكل منهما يضم أيضًا بضع عشرات من الأشخاص. يشبه فريق Infra في بعض الشركات “طرفًا خارجيًا” داخليًا ينجز متطلبات الخوارزميات، لكن فريق Infra في DeepSeek يتدخل في مرحلة تثبيت النسخة (定版) قبل تدريب النموذج، حيث يناقشون ويقدمون اقتراحات.

يؤدي التعاون الوثيق بين هذه الوحدات إلى أن حدود الفرق داخل DeepSeek ليست صارمة جدًا، ويتشكل “تقسيم مهام متداخل”. وهذا بالفعل شكل التعاون الأكثر ملاءمة لطبيعة تدريب النماذج؛ لأن اختيار البيانات وتنفيذ Infra يجب أن يؤخذ في الاعتبار في مرحلتي التجربة (model experiments) وتثبيت النسخة.

ليانغ ونفِنغ هو بمثابة كاشفٍ ومُلزِم (connector) يربط بين هذه الوحدات المختلفة؛ إذ يحضر اجتماعات كل فريق على حدة، ليعرف التقدم العام ونقاط التعثر. كما أن معظم اجتماعات DeepSeek الأسبوعية تكون مفتوحة لأشخاص من فرق أخرى، ما يسمح بحضور عبر المجموعات.

إن أسلوب “المنصب الأول” الذي يغوص في التفاصيل، والتعاون الوثيق الذي يتشكل تلقائيًا، يصعب تحقيقه ضمن منظمة كبيرة. لذلك يتعامل DeepSeek بحذر شديد عند توسيع حجم فريق التطوير الأساسي.

ومن نقطة شديدة التفرد ضمن دوائر الذكاء الاصطناعي عالميًا: لا يعمل DeepSeek لساعات إضافية. فهم لا يحضرون لعملهم ولا توجد معايير تقييم أداء واضحة، وغالبية الأعضاء يغادرون الشركة عادةً بين الساعة 6 والساعة 7 مساءً. كما توفر DeepSeek لموظفيها بشكل مجاني بعض مزايا بعد الدوام، مثل حصص الرياضات/الدروس القائمة على الكرة، وتعويض تكاليف أماكن ممارسة الرياضة.

يعتقد ليانغ ونفِنغ: يصعب أن تتجاوز مدة عمل الشخص اليومية عالية الجودة 6~8 ساعات. ومع إجهاد الساعات الإضافية، فإن الأحكام الغافلة تصبح أكثر احتمالًا لتضييع موارد الحوسبة الثمينة، وهو أمر لا يعود بالنفع.

من حيث توزيع الموظفين، قبل ذلك لم تقم DeepSeek تقريبًا بالتوظيف الاجتماعي (social recruitment/社招)، وكان التركيز على الاحتفاظ بخريجي الجامعات حديثًا والمتدربين. وفي مطلع 2025، قام موقع《晚点》بفرز 172 باحثًا كانوا قد شاركوا في تدريب نماذج DeepSeek الثلاثة (LLM وV2 وV3&R1)، بما في ذلك المتدربين، ثم عثر على سير ذاتية لـ 84 شخصًا منهم: أكثر من 70% كانوا من خريجي البكالوريوس والماجستير، وأكثر من 70% كانوا أقل من 30 عامًا.

قبل V3 وR1، كان DeepSeek يدخل صفوف الطليعة العالمية للنماذج الكبيرة بعدد أفراد يقارب 1/10 من عدد شركات المصانع الكبرى (large firms)، وبنسبة 1/2 من وقت عمل كل شخص، مع تركيز وانكباب شديدين.

لكن مع ازدياد عدد الاتجاهات التي يجب استكشافها للوصول إلى قدرات الذكاء الاصطناعي على مستوى القمة، أصبح من الصعب أكثر فأكثر الحفاظ على حجم التنظيم، وطريقة التواصل، والجو التعاوني بهذه الصورة.

خلال آخر 15 شهرًا، واصل DeepSeek فعل ما يخصه، بينما تغير العالم الخارجي بسرعة

بعد أن انفجرت شعبية V3 وR1 في مطلع عام 2025، لم يواصل DeepSeek تقديم “ضربة قاضية” على الفور، بل اتبع اتجاهاتهم التي يركزون عليها واستمر في تطويره. وتتوزع النتائج المنشورة بالفعل بشكل أساسي إلى ثلاث فئات:

أولًا هي تحسين الكفاءة: الضغط إلى أقصى حد على قدرة حساب GPU، ورفع مستوى الذكاء الذي يمكن إنتاجه لكل وحدة من الحساب. وهذا يشمل حزمة كاملة من البنية التحتية للتدريب والاستدلال (Infra) التي أطلقتها DeepSeek على GitHub في أوائل 2025 في أسبوع من الإطلاق مفتوح المصدر، والتي تشمل kernel للاستدلال، ومكتبات الاتصال، ومكتبات ضرب المصفوفات، وأطر معالجة البيانات. (ملاحظة: kernel هي الشفرة التي تُنفَّذ على GPU لأدنى مستوى من الحساب، وتُستخدم لتنفيذ العمليات الأساسية مثل ضرب المصفوفات.)

ثانيًا تحسينات مستمرة على “آلية الانتباه” (Attention): مثل NSA (Native Sparse Attention) في بداية 2025، ثم DSA (Dynamic Sparse Attention) لاحقًا. وبالإضافة إلى MLA (Multihead Latent Attention) في V2 في وقت سابق، فإن الهدف المشترك لهذه التقنيات هو معالجة سياقات أطول دون زيادة كبيرة في موارد الحساب.

ومن خلال DeepSeek-V3.2 التي تم تحديثها في أواخر سبتمبر 2025، يمكن أيضًا ملاحظة أن DeepSeek استبدلت مكتبة العمليات الأساسية من لغات CUDA وTriton السائدة إلى TileLang. وCUDA هي اللغة منخفضة المستوى التي توفرها شركة NVIDIA، وTriton أطلقته OpenAI كمصدر مفتوح، بينما TileLang هو مشروع مفتوح المصدر أطلقته مجموعة فريق يانغ تشي (杨智) من جامعة بكين (北京大学).

ثالثًا تحسينات في بنية النموذج نفسها، مثل mHC (Multi-Headed Constraint Hyper-Connection/流行约束超连接) التي تم إطلاقها في أوائل 2026، وتهدف إلى تحسين الاستقرار في التدريب واسع النطاق؛ وبناء Engram خارج النموذج لتشكيل ذاكرة طويلة الأمد. ويعتقد أغلب الناس خارج DeepSeek أن mHC سيتم استخدامه في تدريب V4.

وثالثًا بعض الاستكشافات “غير التقليدية”: مثل DeepSeek-OCR، الذي يحوّل النص إلى صور ثم يقدمه للموديل؛ وهي فكرة تهدف إلى جعل النموذج يفهم الفقرات والطبقات بطريقة أقرب إلى “قراءة النص” عند الإنسان، وبالتالي تعزيز قدرته على فهم الوثائق المعقدة.

داخل DeepSeek توجد أيضًا محاولات أخرى جارية من هذا النوع، بما في ذلك التعلم المستمر والتعلم الذاتي.

كما قام ليانغ ونفِنغ في عام 2025 بتجنيد بعض المستشارين ذوي خلفية في علم الأعصاب وعلم الدماغ، بهدف استكشاف آليات تعلم أقرب إلى آلية عمل الدماغ البشري.

وفي الوقت نفسه، تغيرت بيئة الذكاء الاصطناعي الخارجية بشكل حاد من عام 2025 وحتى الآن. وهناك خطّان منافسيان يحظيان بأكبر قدر من الاهتمام:

أولًا: نماذج وتطبيقات Agentic مبنية على قدرات البرمجة (coding). هذا هو ساحة المنافسة الأكثر شدة حاليًا بين Anthropic وOpenAI، وقد نتج عنها مواجهة بين Opus 4.6 وGPT-5.4، وكذلك مواجهة بين منتجي Claude Code وCodex. كما أن OpenClaw صغير الروبيان (小龙虾) الذي انتشر بقوة منذ مطلع العام يمثل أحدث شكل لتطبيقات Agentic.

ثانيًا: توليد متعدد الوسائط. هذا المجال خرج مرارًا إلى دائرة الضوء بسبب “تأثيرات السحر” (magic effects). من GPT-4o في ربيع 2025، إلى NanoBanana من Google في الخريف، وصولًا إلى Seedance 2.0 من ByteDance قبل عيد الربيع في 2026. كما يرتبط توليد الفيديو أيضًا باتجاه أكثر تقدمًا، وهو “نماذج العالم” (world models).

لم يخصص DeepSeek في البداية اهتمامًا كبيرًا لتوليد متعدد الوسائط؛ لأن ليانغ ونفِنغ يرى أن التوليد متعدد الوسائط ليس هو الخط الرئيسي للذكاء.

وعلى اتجاه Agent، قامت DeepSeek-V3.2 بتعزيز قدرات Agent. لكن وتيرة التكرار العامة لـ DeepSeek كانت أقل من تلك لدى R1، ما جعل DeepSeek يشعرون بقلق عميق تجاه “العُملاء/التنافس” من الجهات الصغيرة الأخرى لفترة.

من أوائل 2025 وحتى اليوم، قامت Zhipu وMiniMax وKimi على التوالي بتحديث 5 إصدارات و4 إصدارات و3 إصدارات من نماذجهم، مستهدفة تعزيز Agent أو قدرات البرمجة/الترميز.

وبحسب بيانات OpenRouter، خلال آخر 30 يومًا (من 24 فبراير إلى 26 مارس)، ومن بين أعلى 10 نماذج حسب استهلاك tokens لتطبيق OpenClaw الذي يتم استدعاؤه عبر OpenRouter، توجد 6 نماذج من الصين، بينما جاء DeepSeek-V3.2 في المركز 12. (ملاحظة: OpenRouter يعكس استخدام الأفراد والمطورين الصغار والمتوسطين بشكل أكبر، ويمكن اعتباره فقط مرجعًا لاستهلاك Tokens على مستوى عام.)

ليست أهداف DeepSeek الأكثر شيوعًا؛ يغادر بعض الأشخاص ويبقى آخرون

تفرد DeepSeek يرتبط بهدف AGI الذي يتبناه ليانغ ونفِنغ ويؤمن به. فبالإضافة إلى السعي إلى الحد الأقصى لذكاء النماذج الكبيرة، يرى أن هناك عملين مهمين جدًا أيضًا:

أولًا: بناء نماذج كبيرة اعتمادًا على النظام البيئي المحلي (国产生态).

ستخصص DeepSeek موارد لتكييف GPU المحلية بهدف حل الواقع الذي يتمثل في أن إمدادات GPU عالية الأداء محدودة. على سبيل المثال، بعد تحديث V3.1 في شهر أغسطس من العام الماضي، ذكروا أن UE8M0 FP8 — وهو تنسيق ضغط بيانات — الذي تستخدمه DeepSeek “مصمم خصيصًا للشرائح المحلية من الجيل القادم”. إن استبدال Triton بـ TileLang مفتوح المصدر محليًا الذي تم ذكره سابقًا هو أيضًا من هذا النوع من الأعمال، ما يمنحهم تحكمًا أكبر في الطبقة الأساسية.

وعند التواصل مع العاملين في مجال الذكاء الاصطناعي، طرح ليانغ ونفِنغ أيضًا هذا الافتراض: “هل يمكن استخدام جزء من قدرة الحوسبة الحالية لتحقيق كل الذكاء الحالي؟”

ثانيًا: “ابتكار أصيل” (原创式创新)، أي القيام ببعض الاتجاهات التي لا تتجرأ عليها شركات المصانع الكبيرة أو الشركات الناشئة الأخرى، والتي لا ترغب في المحاولة فيها.

على سبيل المثال، في النصف الثاني من عام 2024، بدأت DeepSeek سلسلة Janus، في محاولة لتوحيد الفهم والتوليد متعدد الوسائط. كما أن DeepSeek أنجزت سابقًا سلسلة Prover لاستكشاف الإثباتات الشكلية. وهناك أيضًا OCR في عام 2025، بالإضافة إلى التعلم المستمر واستكشافات “تقليد/محاكاة” الدماغ التي يستمر العمل عليها داخل الشركة.

وبصفته مؤسسًا، يهتم ليانغ ونفِنغ ليس فقط بنتائج النماذج نفسها، بل أيضًا بالاكتشافات الأكثر جوهرية والأصيلة التي تتحقق في طريق السعي إلى تلك النتائج.

لكن هذا لا يتطابق مع بعض توقعات العالم الخارجي تجاه DeepSeek: فبعض الناس يأملون أن تأتي كل ضربة من DeepSeek مثيرة للصدمة مثل R1، وهذا أمر صعب جدًا، ولا ينسجم أيضًا مع قوانين التطور التقني.

قد لا يهتم ليانغ ونفِنغ بتوقعات الخارج، لكن عليه مواجهة وتدبير توقعات الداخل.

بالنسبة لعدد أكبر من الباحثين الشباب، فإن القيام بأبحاث أكثر في الصف الأول يحتاج إلى تحمل قدر أكبر من عدم اليقين. فالطريق الأكثر أمانًا هو مواصلة المشاركة في أقوى النماذج في المجال، وإدراج أسمائهم في تلك التقارير التقنية التي تحظى بالاهتمام، وإجراء التجارب والاستكشافات بدعم من موارد GPU وفيرة.

بالإضافة إلى الشرف والالتأثير، تكمن جاذبية DeepSeek لأعضاء الفريق أيضًا في وعد الثروة العالية.

يتمتع DeepSeek براتب أساسي مرتفع بشكل مطلق، لكن الراتب الخارجي غالبًا أعلى. وأخبرنا بعض القناصين (headhunters) أن المنافسين عرضوا “أرقامًا يصعب رفضها”، وأن “الزيادة بمقدار 2 إلى 3 أضعاف ليست مشكلة”، وأن “مجموع الحوافز قد يصل إلى رقم من 8 أرقام (إما على شكل أسهم أو خيارات)”.

ومن التغيرات الجديدة أيضًا: تم إدراج MiniMax وZhipu وارتفعت أسعار أسهمهما، كما تم طرح إدراج Kimi أيضًا على جدول الأعمال. وهذا جعل بعض أعضاء DeepSeek لديهم المزيد من الأسئلة بشأن جزء الخيارات في حِزَمهم الذي لا يحمل سعرًا محددًا.

في مواجهة عروض دعوتهم بمبالغ ضخمة، اختار المزيد البقاء. فهم يقرّون أسلوب ليانغ ونفِنغ في السعي إلى AGI، ويرغبون في القيام باستكشافات ليست مدفوعة فقط بالمنافسة، كما اعتادوا على جو بحثي لدى DeepSeek أكثر تساهلًا وهدوءًا.

وبعض الشائعات الخارجية الأخيرة ليست دقيقة. فبالرغم من حدوث تغييرات داخل فريق DeepSeek، إلا أنه لم يحدث نزوح جماعي على شكل مجموعات.

“حتى من بقي، ما زال يحمل قدرًا من المثالية.” قال أشخاص قريبون من DeepSeek. إذ يرى ليانغ ونفِنغ أنه إلى جانب المسار الرئيسي لرفع كفاءة وأداء النموذج، ينبغي أيضًا القيام باتجاهات قد لا تكون العوائد منها واضحة في الوقت الحالي؛ لأن “هناك شركات بالخارج تمتلك موارد حوسبة أكبر مثل Google وOpenAI، ومن المؤكد أنها داخليًا ستجرب شتى الاتجاهات”.

حتى الآن، وبفضل أن فريق DeepSeek صغير نسبيًا، وبفضل شفافية الشركة منذ تأسيسها وأجواء التنظيم الأفقية، ما يزال يمكن للأعضاء أن يقوموا بتقسيم طبيعي للعمل فيما بينهم: أحيانًا يبدأون اتجاهًا جديدًا لأن ثلاثة أو خمسة أشخاص يشعرون أن فكرة ما جيدة، ثم يقومون بتنفيذها معًا.

وهذا يتماشى مع ما وصفه ليانغ ونفِنغ في مقابلة عام 2024 مع《暗涌》: “لا نضع التقسيم المسبق للعمل بشكل عام”. “لكل شخص مسار نموه الفريد، وكلهم يحملون أفكارًا من تلقاء أنفسهم، ولا يحتاجون إلى دفعه… لكن عندما تظهر فكرة ما إمكاناتها، سنقوم بتنسيق الموارد من الأعلى إلى الأسفل.”

“DeepSeek هو مكان يضم أشخاصًا يريدون حقًا إجراء الأبحاث؛ وفي الصين، بل وحتى على مستوى العالم، يمكن العثور على أفضل مكان لهم.” قال أشخاص قريبون من DeepSeek.

تغيير العالم… وتُغيِّرك العالم أيضًا

إن الإدراك الفريد لهدف AGI وتفكيكه، يعد من الجوانب القيّمة لـ DeepSeek، وهو أيضًا سبب التوتر الداخلي الذي يواجهه الآن. لأن ليانغ ونفِنغ يضع أهمية كبيرة على بناء النظام البيئي والاستكشاف الأصيل، بينما ترى الصناعة عمومًا أن “الاستمرار في امتلاك الأقوى” هو أولوية أولى. وعلى الرغم من تشابه الأهداف، فإنها ليست متطابقة تمامًا.

وأيضًا، فقد أصبح معيار “القوة” و”الأصالة” في تطوير النماذج الكبيرة اليوم أكثر غموضًا وذاتية، إلى حدٍ أكبر.

لم تعد درجات Benchmark قادرة على قياس مستوى النموذج بالكامل. وخصوصًا بعد دخول المنافسة على نماذج Agentic، أصبحت “نقاط الاتصال” التي يتعامل معها المنتج وحالات الاستخدام المطولة (long-tail) الناتجة عنها، إضافة إلى البيانات المتنوعة، أكثر أهمية. وهذه بالذات هي منطقة لم يخصص لها DeepSeek استثمارًا كبيرًا في السابق، لأنها تركز أكثر على تطوير النماذج.

أما V4 المرتقب إطلاقه، فمن المحتمل جدًا أنه سيظل أقوى نموذج مفتوح المصدر، لكن من الصعب أن يكون “قويًا بحيث يطغى على الجميع” بشكل ساحق. لأن الآن، بالنسبة لمختلف السيناريوهات، ولدى مختلف المطورين والمستخدمين، أصبحت معايير “القوة” والإحساس بها أكثر تنوعًا.

أما ما يُعتبر استكشافًا أصيلًا وذا قيمة، فدائمًا تختلف الآراء حوله. ويعتمد ذلك على خبرات الباحثين المختلفين، وقراراتهم وحدسهم، ما يُسمى “الذائقة التقنية”.

طريقة التحقق من الذائقة هي التجربة. لكن عدد التجارب وحجمها محدودان أيضًا بموارد GPU. وبالمقارنة مع أقرانه، لا يملك DeepSeek كمية حوسبة كبيرة بنفس القدر.

في النهاية، سواء كان الحديث عن أساسيات النظام البيئي للنماذج الكبيرة أو عن السعي لتحقيق أداء النموذج مع استكشاف اتجاهات قد لا يجرؤ الآخرون على تجربتها، فإن مردود هذه الأعمال التي يقدّرها ليانغ ونفِنغ لا يزال غير واضح بشكل كبير.

البحوث الرائدة يفترض أن تتحمل هذا النوع من عدم اليقين. لكن مع حقيقة محدودية موارد الحوسبة، ومع توقعات العالم الخارجي أن يبقى DeepSeek قادرًا على إبهار الناس باستمرار وربما “الطغيان/السحق”، فإن ذلك لا يتطابق تمامًا.

أدرك ليانغ ونفِنغ الحاجة إلى التغيير. وفي الآونة الأخيرة بدأ يضع طريقة للتفكير في تقييم الشركة (تقييم قيمة) حتى يعطي لفريقه توقعات أكثر وضوحًا.

كما ستزيد DeepSeek من استثماراتها في المنتجات. وقد راجعنا جميع الإعلانات الوظيفية التي نشرها قسم الموارد البشرية (HR) في DeepSeek على وسائل التواصل الاجتماعي من ديسمبر 2024 وحتى الآن. وفي أحدث الإعلانات الوظيفية خلال منتصف مارس، ذَكرت DeepSeek لأول مرة أسماء منتجات محددة لدى الآخرين، وذلك للتجنيد على اتجاه Agent: “مدير منتج لاستراتيجية النماذج (Model Strategy Product Manager)”:

متابعة التطورات في الصناعة بشكل مستمر، والإلمام والاستخدام العميق لتقنيات agent المعروفة مثل Claude Code وOpenClaw وManus…

وبعد ذلك، سيُرى بالتأكيد أن DeepSeek ستقوم بمزيد من التحركات في منتجات Agent.

في مطلع 2025، هزّت DeepSeek الصين والعالم بروح سخية من الانفتاح في المصدر المفتوح وبمعجزة “الاستثمار القليل وتحقيق الكبير”، وغيّرت العالم: جعلت مجموعة من أقرانهم يضعون طاقة أكبر في تقنيات النماذج، وألهمت نماذج لاحقة مثل Kimi K2 وK2-thinking، بل وأسهمت أيضًا بشكل مباشر في ظهور بعض الفرق الجديدة، مثل MiroMind التي يمولها تشن تيان-تشياو.

سبب كونها “معجزة” هو أنها لا تحدث كثيرًا، بل هي حدث منخفض الاحتمال. وفي بيئة الصين التي تتفاخر بالمنافسة و”التحدث عن النتائج”، فإن وجود DeepSeek الذي يجرؤ على السعي لهدف فريد بحد ذاته يعد حدثًا ممتعًا ومفاجئًا منخفض الاحتمال.

التقييم من الأشخاص الذين تعاملوا مع ليانغ ونفِنغ هو: “هو شخص شديد المقاومة للضجيج.”

بعد أن انفجرت شعبية R1 في عام 2025، أظهر ليانغ ونفِنغ موقفًا هادئًا تجاه المطاردة والتطبيل. والآن يواجه تحديًا من نوع آخر: مع اشتداد المنافسة الخارجية، التمييز بين الضجيج والإشارة، والتمسك بما يجب التمسك به، وتغيير ما يجب تغييره.

قال أحد العاملين: “إن الشخص الذي يركّز على العمل بخفض رأسه قد لا يضحك في النهاية على الجميع داخل فيضان السوق العاصف المتعجل، لكن لا يمكن إلا أن ظهور شركات مثل DeepSeek بشكل أكبر هو ما يمنح الصين فرصة أن تنتقل من ‘الاستنساخ’ إلى ‘الريادة’ في التكنولوجيا.”

هذا هو عمل ليانغ ونفِنغ وDeepSeek. أما المزيد من الأشخاص الذين اهتزوا بسبب هذه الشركة، فكل ما يمكنهم فعله بسيط جدًا: إسقاط سرديات المقالات الرائجة (爽文)، والنظر إلى شركة وابتكار تقني بعقلية أكثر هدوءًا وتجردًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.21Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.24%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.15%
  • تثبيت