بحث
آبل تطور RubiCap: ذكاء اصطناعي يتفوق بتوصيف الصور
الذكاء الاصطناعي #آبل #ذكاء_اصطناعي

آبل تطور RubiCap: ذكاء اصطناعي يتفوق بتوصيف الصور

تاريخ النشر: آخر تحديث: 11 مشاهدة 0 تعليق 2 دقائق قراءة
11 مشاهدة
0 إعجاب
0 تعليق
موثوق 95%

كشف باحثو آبل مؤخرًا عن إطار عمل جديد للذكاء الاصطناعي يُدعى RubiCap، متخصص في التوصيف الكثيف للصور (Dense Image Captioning). يهدف هذا الإطار المبتكر إلى توليد أوصاف أكثر دقة وتفصيلاً للصور، وذلك باستخدام نماذج أصغر حجمًا بكثير مقارنة بالتقنيات الحالية.

تُظهر الصورة المرفقة (صورة 1) كيف قامت آبل بتدريب ذكاء اصطناعي قادر على توصيف الصور بشكل أفضل من نماذج أكبر بعشرة أضعاف. يعتمد النهج الجديد على التعلم المعزز الموجه بالمعايير (Rubric-guided Reinforcement Learning)، وقد أثبت كفاءته في تجاوز أداء نماذج ضخمة تصل إلى 72 مليار معلمة في مختلف الاختبارات المعيارية.

ما هو التوصيف الكثيف للصور؟

يختلف التوصيف الكثيف للصور عن التوصيف التقليدي بأنه لا يكتفي بوصف الصورة ككل، بل يحدد الأجسام والمناطق المختلفة داخل الصورة ويقدم وصفًا تفصيليًا لكل منها. توضح الصورة 2 أمثلة من ورقة بحثية أصلية لجامعة ستانفورد حول التوصيف الكثيف، بعنوان DenseCap: Fully Convolutional Localization Networks for Dense Captioning.

مزايا RubiCap وتقنياته

تكمن قوة RubiCap في قدرته على تحقيق نتائج متفوقة بفضل حجمه الصغير نسبيًا. فقد تم استخدام نموذج Qwen2.5-7B-Instruct كقاضٍ (كما تظهر الصورة 3)، لتقييم الأوصاف بناءً على معايير محددة وتوليد إشارة المكافأة المستخدمة في التدريب. هذا النهج سمح للنموذج بتحسين دقة وجودة الأوصاف بشكل مستمر.

قارنت آبل أداء RubiCap بالعديد من النماذج الرائدة الأخرى، مثل Qwen2.5-VL-72B-Instruct و Gemma-3-27B-IT و Qwen3-VL-30B-A3B-Instruct. وأظهرت النتائج أن RubiCap، بأحجام نماذجه المختلفة (RubiCap-2B، RubiCap-3B، RubiCap-7B)، تفوق بشكل ملحوظ على هذه النماذج الأكبر حجمًا. كما تظهر الصورة 4، فقد حققت هذه النماذج أداءً مفاجئًا، متفوقة على نماذج تصل إلى 72 مليار معلمة.

على سبيل المثال، أظهرت مقارنات الأوصاف بين RubiCap-7B-DenseFusion ونموذج Qwen2.5-VL-7B-Instruct تفوقًا واضحًا (صور 5، 6، 7، 8). هذه المقارنات تُبرز قدرة RubiCap على توليد أوصاف أكثر تفصيلاً ودقة، مع الحفاظ على كفاءة النموذج.

يمكن أن تفتح هذه التقنية آفاقًا جديدة في العديد من التطبيقات، مثل تحسين محركات البحث عن الصور، وتعزيز أدوات الوصول للأشخاص ذوي الإعاقة البصرية من خلال توفير أوصاف غنية بالمعلومات. كما أنها تمثل خطوة مهمة نحو تطوير نماذج ذكاء اصطناعي أكثر كفاءة وأقل استهلاكًا للموارد.

استكشف المزيد حول أحدث ابتكارات الذكاء الاصطناعي وكيف تُحدث ثورة في عالم التقنية!

الأسئلة الشائعة

RubiCap هو إطار عمل جديد للذكاء الاصطناعي طورته آبل، متخصص في التوصيف الكثيف للصور، ويولد أوصافًا دقيقة ومفصلة للصور.

يتفوق RubiCap باستخدام التعلم المعزز الموجه بالمعايير، مما يمكنه من تحقيق أداء أفضل من نماذج أكبر حجمًا بكثير (تصل إلى 72 مليار معلمة).

يمكن أن يُستخدم RubiCap في تحسين البحث عن الصور وأدوات الوصول للأشخاص ذوي الإعاقة البصرية، وغيرها من التطبيقات التي تتطلب وصفًا دقيقًا للصور.

التعليقات 0

سجل دخولك لإضافة تعليق

لا توجد تعليقات بعد. كن أول من يعلق!