ويجمع نموذج FastVLM بين الرؤية الحاسوبية ومعالجة اللغة، ما يجعله قادراً على تحليل الصور ومقاطع الفيديو وتقديم وصف دقيق لمحتواها. أما MobileCLIP2، فهو إصدار محسّن يتميز بأنه أسرع بـ85 مرة وأصغر حجماً بـ3.4 مرات مقارنة بالإصدار السابق، ويُظهر كفاءة عالية في الفهم البصري واللغوي.
النماذج الجديدة تعتمد على إطار التعلم الآلي مفتوح المصدر من آبل، وقد صُممت لتعمل بكفاءة على معالجات الشركة الخاصة. وعلى الرغم من أنها لا تولّد صوراً أو فيديوهات، فإنها تُستخدم لشرح المحتوى المرئي بشكل دقيق، ما يجعلها أدوات قوية في تحليل الوسائط.
ويُتوقع أن يكون هذا الإعلان تمهيداً للكشف عن مزايا جديدة في مجال الذكاء الاصطناعي خلال مؤتمر آبل المقبل، المقرر في 9 سبتمبر.
-
أخبار متعلقة
-
جوجل تطلق أندرويد أوتو 15.5 بنسخته التجريبية
-
3 أخطاء شائعة تضعف بطارية هاتفك أو جهازك اللوحي
-
دليلك إلى صناعة المحتوى.. من الفكرة إلى التأثير
-
انقطاع واسع لأشهر التطبيقات بسبب خلل في أمازون ويب.. والشركة توضح السبب!
-
OpenAI توسّع الوصول إلى Sora 2 لتوليد الفيديو بالذكاء الاصطناعي
-
النمسا تدين مايكروسوفت بانتهاك خصوصية بيانات الطلاب
-
كيفية تنظيف منفذ "USB-C" بسهولة وأمان
-
خطوة جديدة من X لمحاربة التضليل