دراسة تكشف تحيز الذكاء الاصطناعي وتقنية ION تقدم الحل
قد تبدو روبوتات الدردشة محايدة في ظاهرها، لكن دراسة جديدة تشير إلى أن بعض النماذج لا تزال تنحاز لأطراف معينة بطريقة مألوفة للبشر. فعند سؤالها عن الفئات الاجتماعية، مالت الأنظمة إلى إظهار مشاعر أكثر دفئاً تجاه "المجموعة الداخلية" (Ingroup) ومشاعر أكثر برودة تجاه "المجموعة الخارجية" (Outgroup)، وهو نمط يُعد علامة أساسية على التحيز الاجتماعي في الذكاء الاصطناعي.
انتشار التحيز عبر النماذج الكبرى
اختبر البحث عدة نماذج لغوية كبيرة، ووجد أن النتائج كانت قابلة للتكرار؛ حيث ظهرت لغة إيجابية أكثر للمجموعات الداخلية ولغة سلبية للمجموعات الخارجية. ولم يقتصر هذا الأمر على نظام بيئي واحد، بل شملت الورقة البحثية نماذج متطورة مثل GPT-4.1 و DeepSeek-3.1 و Llama 4 و Qwen-2.5.
وأشار الباحثون إلى أن صياغة الطلب تؤثر بشكل كبير؛ حيث أدت المطالبات المستهدفة إلى تكثيف التحيز. وفي تلك الاختبارات، زادت اللغة السلبية الموجهة للمجموعات الخارجية بنسبة تتراوح بين 1.19% إلى 21.76% اعتماداً على الإعدادات المستخدمة.
تأثيرات حقيقية وحل واعد
تتجاوز المشكلة مجرد المعرفة الواقعية؛ حيث يمكن لمؤشرات الهوية أن تثير مواقف اجتماعية في الكتابة نفسها، مما يجعل النموذج ينجرف إلى "صوت" منحاز لفئة معينة. يمثل هذا خطراً على الأدوات التي تلخص الحجج أو تدير المحتوى، حيث يمكن لتحولات طفيفة في النبرة أن تغير ما يستنتجه القارئ.
ولكن هناك جانب إيجابي، حيث قدم الفريق البحثي طريقة للتخفيف من هذه المشكلة تُدعى ION (Ingroup-Outgroup Neutralization). تجمع هذه الطريقة بين الضبط الدقيق وتحسين التفضيلات لتضييق الفوارق في المشاعر.
نتائج تقنية ION ونصائح للمستخدمين
في النتائج المُعلن عنها، نجحت تقنية ION في تقليص تباين المشاعر بنسبة تصل إلى 69%. ورغم أن الورقة لم تحدد جدولاً زمنياً لاعتماد هذه التقنية من قبل مزودي النماذج، إلا أن النتائج مشجعة للغاية.
وبانتظار التحديثات الرسمية، يُنصح مطورو الروبوتات بإضافة اختبارات مؤشرات الهوية قبل إطلاق التحديثات. أما بالنسبة للمستخدمين اليوميين، فالأفضل إبقاء الأوامر (Prompts) مرتكزة على السلوكيات والأدلة بدلاً من التسميات الفئوية، خاصة عندما تكون نبرة النص أمراً جوهرياً.
التعليقات 0
سجل دخولك لإضافة تعليق
لا توجد تعليقات بعد. كن أول من يعلق!