MemRL: تقنية ذكاء اصطناعي تتفوق على RAG دون إعادة تدريب

كشف باحثون من جامعة شانغهاي جياو تونغ ومؤسسات أخرى عن تقنية جديدة تُمكّن وكلاء النماذج اللغوية الكبيرة (LLM Agents) من اكتساب مهارات جديدة دون الحاجة إلى عمليات "إعادة التدريب الدقيق" (Fine-tuning) المكلفة والمستهلكة للموارد.

الإطار الجديد، الذي أطلق عليه اسم MemRL، يمنح الذكاء الاصطناعي قدرة مشابهة لـ "الذاكرة العرضية" لدى البشر، مما يسمح له باسترجاع التجارب السابقة لحل مهام لم يواجهها من قبل. وكما تظهر الصورة الأولى المرفقة للمقال، يعتمد هذا النظام على مفهوم الوكيل المتطور ذاتياً الذي يستخدم التغذية الراجعة من البيئة لتحسين استراتيجيات حل المشكلات باستمرار.

معضلة الاستقرار والمرونة

تكمن التحديات الرئيسية في تطبيقات الذكاء الاصطناعي الحالية في كيفية تكييف النموذج مع المعارف الجديدة. الطرق التقليدية مثل إعادة التدريب قد تؤدي إلى ما يعرف بـ "النسيان الكارثي"، حيث تمحو المعلومات الجديدة البيانات القديمة. من ناحية أخرى، تعتبر تقنيات التوليد المعزز بالاسترجاع (RAG) سلبية؛ فهي تسترجع المعلومات بناءً على التشابه الدلالي فقط دون تقييم فائدتها الحقيقية.

يرى الباحثون أن الحل يكمن في محاكاة العقل البشري الذي يفصل بين الاستنتاج المستقر (القشرة الدماغية) والذاكرة العرضية الديناميكية. هذا الفصل يسمح بالتكيف دون الحاجة لـ "إعادة توصيل" الدوائر العصبية للنموذج.

كيف يعمل إطار MemRL؟

في هندسة MemRL، تظل معلمات النموذج اللغوي الكبير (LLM) مجمدة تماماً، حيث يعمل النموذج كـ "قشرة دماغية" مسؤولة عن المنطق والاستنتاج فقط. وللتعامل مع المعلومات الجديدة، يحافظ النظام على مكون ذاكرة ديناميكي.

ويتضح من الصورة الثانية المرفقة التي تشرح هيكلية MemRL، أن النظام لا يخزن نصوصاً مجردة كما في RAG، بل ينظم الذاكرة في ثلاثيات تتكون من: النية (استفسار المستخدم)، التجربة (الحل المتخذ)، والمنفعة (Q-value). تمثل قيمة "Q-value" درجة نجاح هذه التجربة في الماضي.

التفوق عبر التعلم المعزز

النقطة الجوهرية التي تميز MemRL هي دمج التعلم المعزز في عملية الاسترجاع. عندما يقوم الوكيل بمحاولة حل ويحصل على تغذية راجعة (نجاح أو فشل)، يتم تحديث قيمة المنفعة للذاكرة المسترجعة. هذا يخلق حلقة مغلقة تسمح للوكيل بمرور الوقت بتجاهل الذكريات غير المفيدة وإعطاء الأولوية للاستراتيجيات الناجحة.

وفي حديثه لموقع VentureBeat، أوضح "مونينغ ون"، المؤلف المشارك في الورقة البحثية وطالب الدكتوراه في جامعة شانغهاي جياو تونغ، أن MemRL صُمم ليكون بديلاً مباشراً لطبقة الاسترجاع في الأنظمة الحالية، مشيراً إلى أن حسابات قيمة المنفعة تتم بالكامل على وحدة المعالجة المركزية (CPU) مما يعني تكلفة حسابية منخفضة.

أداء يتفوق على المعايير الصناعية

خضع النظام لاختبارات صارمة عبر مقاييس صناعية متنوعة مثل BigCodeBench وALFWorld. وكما تظهر الرسوم البيانية في الصورة الثالثة المرفقة، تفوق MemRL باستمرار على تقنيات RAG التقليدية وأطر الذاكرة الأخرى.

كان التفوق واضحاً بشكل خاص في البيئات التي تتطلب الاستكشاف مثل ALFWorld، حيث حقق MemRL تحسناً نسبياً بنحو 56% مقارنة بإطار MemP. هذا يشير إلى أن النظام لا يحفظ البيانات فحسب، بل يصفي الذكريات منخفضة القيمة بذكاء.

مستقبل الوكلاء الأذكياء

يمثل هذا التطور نقلة نوعية للشركات، حيث يمكن نشر وكلاء بذكاء عام ثم تكييفهم بسرعة مع سير العمل الخاص بالشركة من خلال التفاعل فقط. واختتم "ون" حديثه برؤية مستقبلية قائلاً: "في مستقبل توشك فيه البيانات الثابتة على النفاد، ستصبح تجربة التفاعل التي يولدها كل وكيل ذكي خلال حياته هي الوقود الجديد".

MemRL: تقنية ذكاء اصطناعي تتفوق على RAG دون إعادة تدريب

معضلة الاستقرار والمرونة

كيف يعمل إطار MemRL؟

التفوق عبر التعلم المعزز

أداء يتفوق على المعايير الصناعية

مستقبل الوكلاء الأذكياء

الأمن السيبراني

اختراق Telnyx PyPI: برمجيات خبيثة مخفية بملفات WAV

آلاف المواقع تُسرب مفاتيح API حساسة: مخاطر أمنية جسيمة

تحذير CISA: استغلال خطير في Langflow يهدد تدفقات الذكاء الاصطناعي

Torg Grabber: برنامج خبيث جديد يستهدف مئات محافظ العملات المشفرة

احتيال Bubble: منصة AI تُستغل لسرقة بيانات Microsoft

IRONSCALES: حماية بريد إلكتروني استباقية بتقنيات الذكاء الاصطناعي

التعليقات 0

معضلة الاستقرار والمرونة

كيف يعمل إطار MemRL؟

جوجل جيميني: الشريك المنطقي لذكاء سيري الاصطناعي

دراسة ستانفورد: مخاطر [[الذكاء الاصطناعي]] في تقديم المشورة الشخصية

Bluesky تكشف عن Attie: ذكاء اصطناعي لتخصيص الخلاصات

رحيل جماعي: جميع مؤسسي xAI يغادرون شركة إيلون ماسك للذكاء الاصطناعي

الذكاء الاصطناعي يُحدث ثورة: 170% إنتاجية بـ 80% قوة عاملة

دراسة: روبوتات الدردشة تتجاهل التعليمات البشرية المتزايدة

التفوق عبر التعلم المعزز

أداء يتفوق على المعايير الصناعية

مستقبل الوكلاء الأذكياء

الأمن السيبراني

اختراق Telnyx PyPI: برمجيات خبيثة مخفية بملفات WAV

آلاف المواقع تُسرب مفاتيح API حساسة: مخاطر أمنية جسيمة

تحذير CISA: استغلال خطير في Langflow يهدد تدفقات الذكاء الاصطناعي

Torg Grabber: برنامج خبيث جديد يستهدف مئات محافظ العملات المشفرة

احتيال Bubble: منصة AI تُستغل لسرقة بيانات Microsoft

IRONSCALES: حماية بريد إلكتروني استباقية بتقنيات الذكاء الاصطناعي

شارك هذا المقال

التعليقات 0

صفحات الموقع

مركز المساعدة

سياسة الخصوصية

شروط الاستخدام

من نحن

تواصل معنا