التفكير كتحسين: نموذج EBT في الذكاء الاصطناعي
طور الباحثون في جامعة إلينوي في أوربانا-شامبين وجامعة فيرجينيا نموذجًا معماريًا جديدًا قد يؤدي إلى أنظمة ذكاء اصطناعي أكثر قوة وقدرة على التفكير. يُطلق على هذا النموذج اسم محول قائم على الطاقة (EBT)، ويظهر قدرة طبيعية على استخدام توسيع وقت الاستدلال لحل المشكلات المعقدة. بالنسبة للقطاع، يمكن أن يترجم ذلك إلى تطبيقات ذكاء اصطناعي فعالة من حيث التكلفة يمكنها التعميم على مواقف جديدة دون الحاجة إلى نماذج متخصصة مُعدلة.
تحدي التفكير في النظام 2
في علم النفس، غالبًا ما يتم تقسيم التفكير البشري إلى وضعين: النظام 1، الذي يتميز بالسرعة والحدس، والنظام 2، الذي يتميز بالبطء والتأمل والتحليل. تتفوق النماذج اللغوية الكبيرة الحالية (LLMs) في مهام نمط النظام 1، لكن صناعة الذكاء الاصطناعي تركز بشكل متزايد على تمكين التفكير في النظام 2 لمواجهة تحديات التفكير الأكثر تعقيدًا.
تستخدم نماذج التفكير تقنيات مختلفة لتوسيع وقت الاستدلال لتحسين أدائها في المشكلات الصعبة. إحدى الطرق الشائعة هي التعلم المعزز (RL)، المستخدم في نماذج مثل DeepSeek-R1 ونماذج "o-series" من OpenAI، حيث يتم مكافأة الذكاء الاصطناعي على إنتاج رموز تفكير حتى يصل إلى الإجابة الصحيحة. نهج آخر، يُطلق عليه غالبًا الأفضل من بين n، يتضمن توليد إجابات محتملة متعددة واستخدام آلية تحقق لاختيار الأفضل.
ومع ذلك، فإن هذه الطرق تعاني من عيوب كبيرة. غالبًا ما تكون محدودة لنطاق ضيق من المشكلات القابلة للتحقق بسهولة، مثل الرياضيات والترميز، ويمكن أن تؤدي إلى تدهور الأداء في مهام أخرى مثل الكتابة الإبداعية. علاوة على ذلك، تشير الأدلة الحديثة إلى أن الأساليب المعتمدة على التعلم المعزز قد لا تعلم النماذج مهارات تفكير جديدة، بل تجعلها أكثر احتمالًا لاستخدام أنماط التفكير الناجحة التي تعرفها بالفعل. وهذا يحد من قدرتها على حل المشكلات التي تتطلب استكشافًا حقيقيًا وتكون خارج نطاق تدريبها.
النماذج القائمة على الطاقة (EBM)
تقترح هذه المعمارية نهجًا مختلفًا يعتمد على فئة من النماذج المعروفة بالنماذج القائمة على الطاقة (EBMs). الفكرة الأساسية بسيطة: بدلاً من توليد إجابة مباشرة، يتعلم النموذج "دالة طاقة" تعمل كمدقق. تأخذ هذه الدالة مدخلًا (مثل طلب) وتوقعًا مرشحًا وتعين قيمة، أو "طاقة"، له. تشير درجة الطاقة المنخفضة إلى توافق عالٍ، مما يعني أن التوقع يتناسب جيدًا مع المدخل، بينما تشير درجة الطاقة العالية إلى تطابق ضعيف.
تطبيقًا لذلك في تفكير الذكاء الاصطناعي، يقترح الباحثون في ورقة بحثية أن المطورين يجب أن ينظروا إلى "التفكير كإجراء تحسين بالنسبة إلى مدقق متعلم، يقوم بتقييم التوافق (احتمالية غير طبيعية) بين مدخل وتوقع مرشح." تبدأ العملية بتوقع عشوائي، يتم تحسينه تدريجيًا عن طريق تقليل درجة طاقته واستكشاف مساحة الحلول الممكنة حتى يتقارب نحو إجابة متوافقة للغاية. يعتمد هذا النهج على المبدأ القائل بأن التحقق من الحل غالبًا ما يكون أسهل بكثير من توليد واحد من الصفر.
هذا التصميم "المركز على المدقق" يعالج ثلاثة تحديات رئيسية في التفكير الاصطناعي. أولاً، يسمح بتخصيص ديناميكي للحساب، مما يعني أن النماذج يمكن أن "تفكر" لفترة أطول في المشكلات الصعبة وأقصر في المشكلات السهلة. ثانيًا، يمكن لنماذج EBM التعامل بشكل طبيعي مع عدم اليقين في المشكلات الواقعية حيث لا يوجد جواب واضح واحد. ثالثًا، تعمل كنماذج تحقق خاصة بها، مما يلغي الحاجة إلى نماذج خارجية.
على عكس الأنظمة الأخرى التي تستخدم مولدات ومدققين منفصلين، تجمع نماذج EBM بين الاثنين في نموذج موحد واحد. ميزة رئيسية لهذا الترتيب هي تحسين التعميم. لأن التحقق من حل على بيانات جديدة خارج التوزيع (OOD) غالبًا ما يكون أسهل من توليد إجابة صحيحة، يمكن لنماذج EBM التعامل بشكل أفضل مع السيناريوهات غير المألوفة.
على الرغم من وعدها، عانت نماذج EBM تاريخيًا من صعوبات في التوسع. لحل هذه المشكلة، قدم الباحثون نماذج EBT، وهي نماذج محول متخصصة مصممة لهذا النموذج. تم تدريب EBT أولاً للتحقق من التوافق بين سياق وتوقع، ثم تحسين التوقعات حتى يجدوا الناتج الأقل طاقة (الأكثر توافقًا). هذه العملية تحاكي بشكل فعال عملية التفكير لكل توقع. طور الباحثون نوعين من EBT: نموذج يعتمد على فك التشفير فقط مستوحى من معمارية GPT، ونموذج ثنائي الاتجاه مشابه لـ BERT.
EBTs في العمل
قارن الباحثون EBTs مع المعماريات المعروفة: وصفة المحول الشائعة لتوليد النص (الأنماط المنفصلة) والمحور الانتشاري (DiT) لمهام مثل توقع الفيديو وإزالة الضوضاء من الصور (الأنماط المستمرة). قاموا بتقييم النماذج بناءً على معيارين رئيسيين: "قابلية التعلم"، أو مدى كفاءة تدريبها، و"قابلية التفكير"، التي تقيس مدى تحسين الأداء مع المزيد من الحسابات في وقت الاستدلال.
أثناء التدريب المسبق، أظهرت EBTs كفاءة متفوقة، حيث حققت معدل توسيع أعلى بنسبة تصل إلى 35% مقارنةً بـ Transformer++ عبر البيانات، وحجم الدفعة، والمعلمات، والحساب. وهذا يعني أن EBTs يمكن تدريبها بشكل أسرع وأرخص.
في وقت الاستدلال، تفوقت EBTs أيضًا على النماذج الحالية في مهام التفكير. من خلال "التفكير لفترة أطول" (باستخدام المزيد من خطوات التحسين) وأداء "التحقق الذاتي" (توليد مرشحين متعددين واختيار الذي لديه أدنى طاقة)، حسنت EBTs أداء نمذجة اللغة بنسبة 29% أكثر من Transformer++. "هذا يتماشى مع ادعاءاتنا بأنه نظرًا لأن المحولات التقليدية التي تعتمد على التغذية الأمامية لا يمكنها تخصيص حساب إضافي ديناميكي لكل توقع يتم إجراؤه، فإنها غير قادرة على تحسين الأداء لكل رمز من خلال التفكير لفترة أطول،" يكتب الباحثون.
في إزالة الضوضاء من الصور، حققت EBTs نتائج أفضل من DiTs بينما استخدمت 99% أقل من التمريرات الأمامية.
الأهم من ذلك، وجدت الدراسة أن EBTs تتعمق بشكل أفضل من المعماريات الأخرى. حتى مع أداء تدريب مسبق مماثل أو أسوأ، تفوقت EBTs على النماذج الحالية في المهام اللاحقة. كانت المكاسب في الأداء الناتجة عن التفكير في النظام 2 أكثر وضوحًا على البيانات التي كانت خارج التوزيع (مختلفة عن بيانات التدريب)، مما يشير إلى أن EBTs قوية بشكل خاص عندما تواجه مهام جديدة وصعبة.
يقترح الباحثون أن "فوائد تفكير EBTs ليست موحدة عبر جميع البيانات، ولكنها تتوسع بشكل إيجابي مع حجم التحولات التوزيعية، مما يبرز التفكير كآلية حاسمة للتعميم القوي خارج توزيعات التدريب."
تعتبر فوائد EBTs مهمة لسببين. أولاً، تشير إلى أنه على نطاق نماذج الأساس الضخمة اليوم، يمكن أن تتفوق EBTs بشكل كبير على معمارية المحول الكلاسيكية المستخدمة في LLMs. يشير المؤلفون إلى أنه "على نطاق نماذج الأساس الحديثة المدربة على 1,000X من البيانات مع نماذج أكبر بـ 1,000X، نتوقع أن يكون أداء التدريب المسبق لـ EBTs أفضل بكثير من أداء وصفة Transformer++."
ثانيًا، تظهر EBTs كفاءة بيانات أفضل بكثير. هذه ميزة حاسمة في عصر أصبحت فيه البيانات عالية الجودة عائقًا رئيسيًا أمام توسيع الذكاء الاصطناعي. "نظرًا لأن البيانات أصبحت واحدة من العوامل الرئيسية المحددة في توسيع المزيد، فإن هذا يجعل EBTs جذابة بشكل خاص،" تختتم الورقة.
على الرغم من آلية الاستدلال المختلفة، فإن معمارية EBT متوافقة للغاية مع المحول، مما يجعل من الممكن استخدامها كبديل مباشر لنماذج LLM الحالية.
قال غلادستون: "تتوافق EBTs بشكل جيد مع أطر الأجهزة/الاستدلال الحالية"، بما في ذلك فك التشفير التخميني باستخدام نماذج التغذية الأمامية على كل من وحدات معالجة الرسومات (GPUs) أو وحدات معالجة التوتر (TPUs). وأعرب عن ثقته أيضًا في أنها يمكن أن تعمل على مسرعات متخصصة مثل LPUs وخوارزميات تحسين مثل FlashAttention-3، أو يمكن نشرها من خلال أطر استدلال شائعة مثل vLLM.
يمكن أن تجعل القدرات القوية في التفكير والاستدلال التي تتمتع بها نماذج EBTs منها أساسًا قويًا وموثوقًا لبناء الجيل القادم من تطبيقات الذكاء الاصطناعي، سواء للمطورين أو المؤسسات. قال غلادستون: "يمكن أن يساعد التفكير العميق بشكل عام في معظم تطبيقات المؤسسات، لكن أعتقد أن الأكثر إثارة ستكون تلك التي تتطلب اتخاذ قرارات أكثر أهمية، أو تلك المتعلقة بالسلامة، أو التطبيقات التي تعتمد على بيانات محدودة".
في الختام، يمثل مفهوم "التفكير كتحسين" خطوة جديدة في تطوير نماذج الذكاء الاصطناعي. من خلال التركيز على تحسين الأداء بدلاً من مجرد الاستجابة للبيانات، يمكننا بناء نماذج أكثر قوة ومرونة. هذا النهج لا يقتصر فقط على تحسين النتائج، بل يعزز أيضًا القدرة على التعلم من التجارب السابقة. مما يعني أن النماذج ستكون أكثر قدرة على التكيف مع التغيرات في البيانات والبيئات المختلفة. في المستقبل، يمكن أن يؤدي هذا الاتجاه إلى تطوير نماذج ذكاء اصطناعي أكثر ذكاءً، قادرة على التعامل مع مجموعة واسعة من المهام بكفاءة. سيكون لهذا تأثير كبير على العديد من المجالات، من الرعاية الصحية إلى التعليم، مما يجعل الذكاء الاصطناعي أداة أكثر قوة في يد البشرية. في النهاية، يتطلب تحقيق هذه الرؤية تعاونًا بين الباحثين والممارسين في مجال الذكاء الاصطناعي. من خلال العمل معًا، يمكننا دفع حدود ما هو ممكن وتحقيق نتائج مذهلة.
[IMAGE:N]
[VIDEO:N]
التعليقات 0
سجل دخولك لإضافة تعليق
لا توجد تعليقات بعد. كن أول من يعلق!