بحث
آبل تطور ذكاء اصطناعي يتفوق على GPT-5 في تصميم الواجهات
الذكاء الاصطناعي #آبل #الذكاء_الاصطناعي

آبل تطور ذكاء اصطناعي يتفوق على GPT-5 في تصميم الواجهات

منذ ساعة 2 مشاهدة 0 تعليق 3 دقائق قراءة
2 مشاهدة
0 إعجاب
0 تعليق
موثوق 95%

في دراسة مفاجئة، أثبت باحثو شركة آبل أن النماذج الصغيرة يمكنها التفوق على GPT-5 في تصميم واجهات المستخدم إذا تم تدريبها بطريقة "المصمم أولاً". تواصل آبل استكشاف كيف يمكن للذكاء الاصطناعي التوليدي تحسين خطوط إنتاج التطبيقات، وهذه المرة بتركيز مختلف تماماً.

منهجية جديدة تتجاوز مجرد كتابة الكود

قبل بضعة أشهر، نشر فريق من باحثي آبل دراسة حول تدريب الذكاء الاصطناعي على توليد كود واجهة مستخدم (UI) وظيفي. ركزت تلك الدراسة، التي أنتجت عائلة نماذج "UICoder" مفتوحة المصدر، على التأكد من أن الكود يعمل فعلياً ويطابق طلب المستخدم بشكل تقريبي، بدلاً من التركيز على جمالية التصميم.

الآن، أصدر جزء من الفريق المسؤول عن UICoder ورقة بحثية جديدة بعنوان "تحسين نماذج توليد واجهة المستخدم من خلال ملاحظات المصممين". يوضح الباحثون أن أساليب التعلم المعزز من ردود الفعل البشرية (RLHF) الحالية ليست الأفضل لتدريب النماذج اللغوية الكبيرة على تصميم واجهات جيدة، لأنها تتجاهل المنطق الغني الذي يستخدمه المصممين لانتقاد وتحسين التصاميم.

كما تظهر الصورة أدناه، تستكشف آبل كيف يمكن للذكاء الاصطناعي التوليدي تحسين عمليات تطوير التطبيقات من خلال دمج ملاحظات الخبراء.

(صورة 1)

المصممون "يدرّبون" الذكاء الاصطناعي

لمواجهة هذه المشكلة، اقترح الباحثون مساراً مختلفاً. قام مصممون محترفون بنقد وتحسين الواجهات التي أنشأها النموذج مباشرة باستخدام التعليقات، والرسومات التخطيطية (Sketches)، وحتى التعديلات اليدوية المباشرة. ثم تم تحويل هذه التغييرات "قبل وبعد" إلى بيانات استُخدمت لضبط النموذج بدقة.

سمح هذا النهج بتدريب "نموذج مكافأة" (Reward Model) بناءً على تحسينات تصميم ملموسة، مما علم مولد الواجهات بشكل فعال تفضيل التخطيطات والمكونات التي تعكس حكماً تصميمياً واقعياً. وتوضح الصورة التالية كيف تم تدريب نموذج المكافأة على تحسينات التصميم الملموسة لتعليم المولد تفضيل تخطيطات أفضل.

(صورة 2)

تفاصيل التجربة والأرقام

شارك في الدراسة 21 مصمماً بمستويات خبرة تتراوح بين عامين وأكثر من 30 عاماً، يعملون في مجالات مختلفة مثل تصميم واجهة المستخدم/تجربة المستخدم وتصميم المنتجات. جمع الباحثون 1,460 تعليقاً توضيحياً، تم تحويلها إلى أمثلة "تفضيل" للواجهة، تقارن بين الواجهة الأصلية التي أنشأها النموذج والنسخة المحسنة من قبل المصممين.

استُخدمت هذه البيانات لتدريب نموذج مكافأة يقبل لقطة شاشة للواجهة ووصفاً نصياً، لإنتاج درجة رقمية تعكس جودة التصميم. ولتعيين مكافآت لكود HTML، استخدم الباحثون خط أنابيب عرض تلقائي لتحويل الكود إلى لقطات شاشة، كما يظهر في الصورة أدناه.

(صورة 3)

النتائج: التفوق على العمالقة

هل نجحت الطريقة؟ وفقاً للباحثين، الإجابة هي نعم، مع بعض الملاحظات المهمة. النماذج التي تم تدريبها على ملاحظات المصممين الأصلية (خاصة مع الرسومات والتعديلات المباشرة) أنتجت واجهات ذات جودة أعلى بشكل ملحوظ مقارنة بالنماذج الأساسية أو تلك المدربة باستخدام بيانات التصنيف التقليدية.

المفاجأة الأكبر كانت أن نموذج آبل الأفضل أداءً (Qwen3-Coder الذي تم ضبطه بدقة مع ملاحظات الرسومات) تفوق على GPT-5. والأكثر إثارة للإعجاب أن هذا التفوق تحقق بناءً على 181 تعليقاً تخطيطياً فقط من المصممين.

وتشير الصورة التالية إلى النتائج التي توصل إليها الباحثون، مؤكدين نجاح التجربة مع وجود بعض المحاذير الهامة.

(صورة 4)

تحدي الذاتية في التصميم

أشار الباحثون إلى أن "الذاتية" تلعب دوراً كبيراً في تحديد ما يشكل واجهة جيدة. في الدراسة، ظهر هذا التباين كخلاف حول التصاميم الأفضل. عندما قيّم الباحثون بشكل مستقل أزواج واجهة المستخدم التي صنفها المصممون، اتفقوا مع خيارات المصممين بنسبة 49.2% فقط.

في المقابل، عندما قدم المصممون ملاحظات عن طريق رسم التحسينات أو تحرير الواجهات مباشرة، اتفق فريق البحث مع تلك التحسينات في كثير من الأحيان: 63.6% للرسومات، و76.1% للتعديلات المباشرة.

تُظهر الصورة الأخيرة كيف أن كمية صغيرة من ملاحظات الخبراء عالية الجودة يمكن أن تمكن النماذج الأصغر من التفوق على النماذج اللغوية الكبيرة في توليد واجهة المستخدم.

(صورة 5)

بمعنى آخر، عندما تمكن المصممون من إظهار ما يريدون تغييره بالتحديد بدلاً من مجرد الاختيار بين خيارين، كان من الأسهل الاتفاق على معنى "الأفضل".

الأسئلة الشائعة

اعتمدت آبل على ملاحظات مصممين محترفين شملت رسومات تخطيطية وتعديلات مباشرة على الكود، بدلاً من نظام التقييم التقليدي.

نعم، أظهرت الدراسة أن نموذج Qwen3-Coder المعدل بناءً على رسومات المصممين تفوق على GPT-5 في مهام توليد واجهات المستخدم.

التحدي الرئيسي هو الذاتية في تقييم التصميم، حيث يختلف البشر في تحديد ما هو 'جيد'، لكن التعديلات المباشرة قللت من هذا التباين.

التعليقات 0

سجل دخولك لإضافة تعليق

لا توجد تعليقات بعد. كن أول من يعلق!