وداعاً للبحث المتجهي: PageIndex يحقق دقة 98.7% في تقنيات RAG
يواجه مطورو تقنيات الذكاء الاصطناعي تحدياً كبيراً عند التعامل مع المستندات الطويلة والمعقدة، لكن إطار عمل جديداً مفتوح المصدر يُدعى PageIndex قد وجد الحل، محققاً دقة مذهلة بلغت 98.7% في الاختبارات المعيارية، متفوقاً بذلك على تقنيات البحث المتجهي التقليدية.
ثورة على أسلوب "التقطيع والتضمين"
تعمل تقنيات التوليد المعزز بالاسترجاع (RAG) التقليدية عادةً عن طريق تقسيم المستندات إلى أجزاء صغيرة (Chunks)، وتحويلها إلى متجهات رقمية (Embeddings)، ثم البحث عن التطابق الدلالي. تنجح هذه الطريقة في المهام البسيطة، لكنها تفشل غالباً عندما تحاول الشركات تطبيقها على تدفقات عمل حساسة مثل تدقيق البيانات المالية أو تحليل العقود القانونية.
يتخلى PageIndex تماماً عن هذا الأسلوب التقليدي، ويتعامل مع استرجاع المستندات ليس كمشكلة بحث، بل كمشكلة "تصفح" أو ملاحة (Navigation Problem)، مستلهماً ذلك من تقنيات الذكاء الاصطناعي في الألعاب.
البحث الشجري: نهج AlphaGo للمستندات
بدلاً من مسح الفقرات خطياً، يحاكي PageIndex السلوك البشري في البحث. عندما يبحث الإنسان في كتاب ضخم، فإنه ينظر إلى جدول المحتويات، يحدد الفصل، ثم القسم، وصولاً للصفحة المطلوبة. يقوم إطار العمل الجديد ببناء "فهرس عالمي" لهيكل المستند، مما يخلق شجرة تمثل الفصول والأقسام.
ويوضح "مينغتيان تشانغ"، المؤسس المشارك لـ PageIndex، أن النظام يطبق فكرة "البحث الشجري" (Tree Search) على استرجاع المستندات، ويمكن اعتباره نظاماً شبيهاً بـ AlphaGo ولكن للاسترجاع بدلاً من الألعاب. هذا يحول النموذج من مجرد مسترجع سلبي للنصوص إلى وكيل نشط يقرر أين يبحث.
لماذا يفشل البحث المتجهي؟
تكمن المشكلة الأساسية في RAG التقليدي في اعتماده على التشابه الدلالي. في المجالات المهنية، التشابه لا يعني دائماً الصلة. يضرب "تشانغ" مثالاً بالتقارير المالية؛ إذا سأل المحلل عن "EBITDA"، سيجلب البحث المتجهي كل ذكر للمصطلح، بينما قد يحتاج المحلل فقط للقسم الذي يعرف طريقة الحساب لهذا الربع السنوي تحديداً.
دقة 98.7% وحل مشكلة الاستدلال متعدد الخطوات
أثبت PageIndex كفاءته في اختبار FinanceBench المعياري، حيث حقق نظام مبني عليه يُدعى "Mafin 2.5" دقة بلغت 98.7%. يبرز التفوق بوضوح في الاستعلامات التي تتطلب تتبع المراجع الداخلية (Multi-hop reasoning).
على سبيل المثال، إذا أشار تقرير في متنه الرئيسي إلى "انظر الملحق G للمزيد من التفاصيل"، فإن الأنظمة التقليدية تفشل لأن الملحق G (الذي قد يكون جدول أرقام) لا يشبه دلالياً السؤال النصي. أما PageIndex، فيفهم الإشارة الهيكلية، وينتقل للملحق الصحيح لاستخراج الرقم الدقيق.
وداعاً لقواعد البيانات المتجهية؟
من المزايا التقنية البارزة لـ PageIndex هو تبسيط البنية التحتية. نظراً لعدم الاعتماد على المتجهات (Embeddings)، لم تعد الشركات بحاجة لصيانة قواعد بيانات متجهية معقدة. يمكن للفهرس الهيكلي الخفيف أن يعمل ضمن قواعد بيانات علائقية تقليدية مثل PostgreSQL.
ورغم أن البحث الشجري قد يبدو أبطأ نظرياً، إلا أن "تشانغ" يؤكد أن الزمن المستغرق حتى ظهور أول كلمة (TTFT) مماثل للمكالمات العادية للنماذج اللغوية، لأن عملية الاسترجاع تتم بالتزامن مع عملية التفكير والتوليد (Streaming)، ولا تشكل بوابة إغلاق تمنع البدء في الإجابة.
مستقبل الاسترجاع القائم على الوكلاء
يمثل PageIndex خطوة نحو ما يسمى "Agentic RAG"، حيث تنتقل مسؤولية البحث من طبقة قاعدة البيانات إلى طبقة النموذج نفسه. وهذا يشبه ما نراه في أدوات برمجية مثل Claude Code و Cursor التي تستكشف قواعد الأكواد بشكل نشط بدلاً من البحث البسيط. ويرى "تشانغ" أن دور قواعد البيانات المتجهية كخيار افتراضي للذكاء الاصطناعي قد يتراجع مع تطور هذه التقنيات.
الأسئلة الشائعة
PageIndex هو إطار عمل مفتوح المصدر يستخدم البحث الشجري (Tree Search) لتصفح هيكل المستندات بدلاً من البحث المتجهي الذي يعتمد على التشابه الدلالي، مما يجعله أدق في المستندات الطويلة.
حقق نظام Mafin 2.5 المبني على PageIndex دقة بنسبة 98.7% في اختبار FinanceBench المخصص للتقارير المالية المعقدة.
لا، لا يعتمد PageIndex على التضمينات (Embeddings)، ويمكن تخزين الفهرس الهيكلي الخاص به في قواعد بيانات تقليدية مثل PostgreSQL.
التعليقات 0
سجل دخولك لإضافة تعليق
لا توجد تعليقات بعد. كن أول من يعلق!