داخل كلود أوبوس 4.7: النموذج الجديد لشركة أنثروبيك يرفع المعايير للهندسة البرمجية الذاتية

باختصار

أصدرت شركة أنتروبيك للأبحاث والأمان في الذكاء الاصطناعي نسخة كودول أوبيس 4.7، التي تحسن هندسة البرمجيات، والتفكير متعدد الوسائط، ومعالجة السياق الطويل، ودقة التعليمات للمهام المعقدة والطويلة الأمد عبر سير عمل المؤسسات.

Inside Claude Opus 4.7: Anthropic’s New Model Raises The Bar For Autonomous Software Engineering أطلقت شركة أبحاث وأمان الذكاء الاصطناعي أنتروبيك نسخة كودول أوبيس 4.7، وهي نموذج جديد يُعتبر ترقية تدريجية ولكن ملحوظة على إصدار أوبيس 4.6، مع التركيز بشكل خاص على تحسينات في هندسة البرمجيات المتقدمة وتنفيذ المهام المعقدة. تم تصميم النموذج للتعامل مع سير العمل الطويل والمعقد تقنيًا بمزيد من الاتساق، واتباع التعليمات بدقة أكبر، وتحسين التحقق الداخلي من المخرجات قبل توليد الاستجابة.

ووفقًا للشركة، يُظهر أوبيس 4.7 أداءً أقوى في السيناريوهات التي تتطلب تحديات برمجية معقدة، حيث كانت الإصدارات السابقة تتطلب غالبًا إشرافًا بشريًا أقرب. يوصف النموذج بأنه أكثر قدرة على الحفاظ على الصرامة عبر تسلسلات حل المشكلات الممتدة، مع تقليل الميل إلى حذف أو تفسير التعليمات متعددة الخطوات بشكل خاطئ. في الاستخدامات العملية، يُهدف إلى دعم التنفيذ الذاتي لمهام هندسية صعبة، بما في ذلك تصحيح الأخطاء، وتصميم الأنظمة، وتوليد الشفرات المنظمة.

تقديم قدرات موسعة في الأداء متعدد الوسائط ومعالجة السياق الطويل

واحدة من التحسينات الرئيسية التي أُبرزت في الإصدار هي تعزيز قدرة النموذج على التعامل مع الوسائط المتعددة، خاصة في الفهم البصري. يستطيع أوبيس 4.7 معالجة صور عالية الدقة مقارنة بالإصدارات السابقة، مما يسمح بتفسير أكثر تفصيلًا للمدخلات البصرية المعقدة مثل لقطات الشاشة الكثيفة، والرسوم البيانية التقنية، وواجهات التصميم. يُعتبر هذا التحديث مهمًا للتطبيقات التي تتطلب دقة بكسل، بما في ذلك تحليل الواجهات واستخراج المستندات.

كما أشارت أنتروبيك إلى تحسينات في جودة المخرجات للمهام المهنية والإبداعية. يُقال إن النموذج يُنتج عروضًا أكثر تنظيمًا، وتوثيقات أوضح، وتصميمات واجهات محسنة عند استخدامه في سياقات الإنتاجية. تُعتبر هذه التغييرات جزءًا من جهد أوسع لزيادة الفائدة في بيئات المؤسسات الواقعية بدلاً من مجرد تحسينات تعتمد على الاختبارات المعيارية.

كما تم اختبار النظام في مجالات تتطلب التفكير في سياق طويل واحتفاظ بالذاكرة. يُوصف أوبيس 4.7 بأنه أفضل في الحفاظ على المعلومات السياقية المستندة إلى الملفات عبر جلسات ممتدة، مما يسمح له باستئناف سير العمل المعقد مع تقليل الحاجة لإعادة إدخال المعلومات الخلفية بشكل متكرر. يُهدف ذلك إلى دعم تطوير وتحليل المهام عبر جلسات متعددة حيث يكون الاستمرارية مهمّة.

إلى جانب تحديثات الأداء، ركزت أنتروبيك على السلامة ونشر القدرات بشكل مراقب. يُقدم النموذج مع تدابير حماية تهدف إلى اكتشاف ومنع الطلبات عالية المخاطر أو المحظورة المتعلقة بالأمن السيبراني. أشارت الشركة إلى أن هذا الإصدار جزء من نهج أبحاث أوسع، حيث تُستخدم أنظمة أقل تقدمًا لاختبار آليات السلامة قبل تطبيقها على نماذج أكثر قدرة. على الرغم من أن أداء الأمان السيبراني العام مقيد عمدًا مقارنة بالأنظمة الداخلية الأكثر تقدمًا، إلا أن النموذج لا يزال متاحًا للاستخدامات الأمنية المشروعة من خلال برنامج تحقق منظم.

تشير نتائج التقييم التي شاركتها الشركة إلى أن أوبيس 4.7 يحافظ على ملف أمان مشابه إلى حد كبير لسابقه، مع تحسينات في بعض المجالات مثل مقاومة حقن التعليمات وتقليل السلوك الخادع، إلى جانب تراجعات طفيفة في مجالات معينة تتعلق بالتوجيهات الحساسة والمفصلة بشكل مفرط. تصف تقييمات التوافق الشاملة النموذج بأنه موثوق إلى حد كبير، رغم أنه لا يخلو من العيوب في الحالات الحدية.

كما أدخل الإصدار تغييرات على التحكم التشغيلي وأدوات المطورين. أُضيف إعداد جهد وسيط جديد يسمح بموازنة أكثر دقة بين جودة الاستجابة والكمون. تشمل الميزات الإضافية دعمًا موسعًا لدقة الصور، وأدوات إدارة استخدام الرموز، وتحديث أوامر سير العمل المصممة لتحسين عمليات مراجعة الشفرات وتنفيذ المهام بواسطة الوكلاء.

يتم نشر أوبيس 4.7 عبر منتجات أنتروبيك الخاصة بالإضافة إلى مزودي البنية التحتية الخارجيين، مع الحفاظ على التسعير عند نفس مستوى الإصدارات السابقة. تشمل اعتبارات الترحيل تغييرات في سلوك التوكن وزيادة في verbosity المخرجات في أوضاع الجهد العالي، وهي عوامل قد تؤثر على التكامل في أنظمة الإنتاج، لكنها تُعرض كتضحيات من أجل تحسين موثوقية التفكير.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت