لقد لاحظت حركة مثيرة للاهتمام. يبدو أن Moondream أطلقت خدمة جديدة تسمى "Lens" لتحسين دقة نماذج اللغة البصرية بشكل خاص. وكان ذلك في الأسبوع الماضي، في 21 أبريل.



حتى الآن، كانت نماذج اللغة البصرية تعمل بشكل ممتاز في المختبر، لكن عندما تُستخدم في الواقع، كانت دقتها تنخفض بشكل كبير. وتهدف خدمة "Lens" إلى إصلاح ذلك من خلال التخصيص الدقيق، وهي تدعم التعلم المعزز والتخصيص بالإشراف. وهي خدمة تعتمد على واجهة برمجة تطبيقات برسوم حسب الاستخدام، بحيث يمكن استخدامها فقط عند الحاجة.

ما يميزها هو القدرة على تحقيق تحسينات كبيرة باستخدام كمية صغيرة من البيانات. كمثال، عند استخدامها لتحليل بث مباشر لمباريات NBA، ارتفعت درجة F1 من 28% إلى 79%. كما انخفضت الأخطاء بشكل كبير.

وفي مهام مثل التعرف على الدولة من صور جولة الشوارع أو معالجة الصور الطبية، أظهرت أداء يتفوق على النماذج الحالية. ويبدو أن تطبيق نماذج اللغة البصرية قد تقدم خطوة مهمة.

شريك Moondream الأول، PTZOptics، يخطط لدمج "Lens" لتحسين دقة تتبع الأهداف والكشف عن الحالات غير الطبيعية. كانت Moondream قد أطلقت سابقًا محرك استنتاج Photon، لكن "Lens" يكمل ذلك، حيث يهدف إلى الجمع بين السرعة والدقة في تشغيل نماذج اللغة البصرية.

نحو حل تحديات التطبيق في العالم الحقيقي باستخدام التقنية. مثل هذه التحسينات المستمرة ستؤدي على الأرجح إلى انتشار واسع لنماذج اللغة البصرية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت