أدوبي تحت النار القانونية: متهمة بتدريب الذكاء الاصطناعي باستخدام كتب مقرصنة عبر سلسلة بيانات ملوثة

2026-01-12 09:03:02

لقد فتحت الذكاء الاصطناعي التوليدي صندوق باندورا قانوني لصناعة التكنولوجيا. بينما كانت شركة أدوبي تراهن على توسيع ترسانتها من الأدوات المدعومة بالذكاء الاصطناعي مع منتجات مثل فايرفلاي، تهدد دعوى جماعية جديدة بتفكيك أسس كيفية بناء هذه الأنظمة. الاتهام مباشر: استخدمت شركة البرمجيات أعمالًا أدبية مقرصنة لتدريب SlimLM، سلسلة نماذج اللغة الخاصة بها والمُحسنة للمهام الوثائقية على الأجهزة المحمولة.

الطريق الملوث لبيانات التدريب

جوهر النزاع يكمن في كيفية حصول أدوبي على بياناتها. وفقًا للدعوى المقدمة من إليزابيث ليون، مؤلفة من أوريغون ومتخصصة في أدلة غير روائية، تم تدريب SlimLM مسبقًا باستخدام SlimPajama-627B، مجموعة بيانات أطلقتها Cerebras في 2023. لكن المشكلة الحرجة هنا: SlimPajama ليست مجموعة بيانات نقية. تم إنشاؤها من خلال معالجة وتلاعب بـ RedPajama، الذي يحتوي بدوره على مجموعة فرعية من البيانات المعروفة باسم Books3، وهي مجموعة ضخمة من 191,000 مجلد.

هذه السلسلة من الاشتقاقات هي ما يعزز القضية القانونية. يجادل محامو ليون بأن استخدام مجموعة بيانات معالجة أصلاً من Books3، أدى بشكل غير مباشر إلى دمج أدوبي لآلاف الأعمال المحمية بحقوق الطبع والنشر دون موافقة أو تعويض. كانت Books3 مصدر التلوث في العديد من مبادرات تدريب الذكاء الاصطناعي، وكل دعوى جديدة تكشف كيف يواصل المطورون تكرار هذه الدورة.

موجة من الدعاوى التي تحدد الصناعة

ليست أدوبي وحدها في هذا المأزق القانوني. في سبتمبر، واجهت شركة أبل اتهامات مماثلة لدمج مواد محمية بحقوق الطبع والنشر في نموذجها Apple Intelligence، مع ذكر صريح مرة أخرى لـ RedPajama كمصدر للتلوث البيانات. بعد أسابيع قليلة، تلقت شركة Salesforce ضربة قانونية مماثلة، مرتبطة أيضًا باستخدام مجموعات بيانات تحتوي على أعمال مقرصنة.

النمط لا يمكن إنكاره: لقد بنت الشركات التقنية الكبرى أنظمتها للذكاء الاصطناعي على هياكل بيانات تلوثت منذ نشأتها. هذا ليس إهمالًا عرضيًا، بل نتيجة لصناعة أعطت الأولوية لسرعة التطوير على الحساب القانوني.

سابقة غيرت اللعبة

وصلت الاتفاقية الأهم حتى الآن عندما وافقت شركة Anthropic، منشئة روبوت الدردشة Claude، على دفع 1.5 مليار دولار للمؤلفين الذين رفعوا دعاوى ضدها لاستخدام نسخ مقرصنة من كتاباتهم. يُعتبر هذا الترتيب نقطة تحول، وإشارة إلى أن المحاكم تأخذ حماية حقوق الطبع والنشر على محمل الجد في عصر الذكاء الاصطناعي.

مع كل قضية جديدة تشير إلى Books3، RedPajama واشتقاقاتها كمصدر لانتهاك، تواجه الصناعة واقعًا غير مريح: معظم نماذج الذكاء الاصطناعي الحالية تعتمد على قواعد قانونية قابلة للنقاش. ما بدأ كدعوى ضد أدوبي قد ينتهي ليكون محفزًا لإعادة التفكير تمامًا في كيفية تطوير وتدريب أنظمة الذكاء الاصطناعي.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.