صانعو الآلة: استكشاف التحيزات في عالم الذكاء الاصطناعي

في غمرة انتشار نماذج الذكاء الاصطناعي التفاعلية المدربة على الإجابة عن أي سؤال يخطر بالبال، ظهر في أوساط الهواة والمستخدمين نمط من المشاغبة يتمثل في محاولة (ليّ ذراع) النموذج ليخرج عن تحفظه والقوانين التي تحكمه ويعطي إجابات صريحة لم يكن ينبغي عليه التصريح بها في محادثته مع المستخدمين، وذلك في سياق ما يعرف بحَقن الأوامر –Prompt injection – ، وقد سُئل أحد هذه النماذج من خلال هذه الطريقة التحيّلية أن يقوم بإعداد قائمة لأبرز التحيزات الاجتماعية التي يقع فيها، فكان اعتراف النموذج بأنه يقع في تحيزات تفضيلية لصالح العديد من القضايا المثيرة للجدل كالهوية الجنسية وذلك بدعم حقوق الشواذ والمتحولين جنسياً وحقهم في التبني، ودعم تشريع السماح للنساء بالإجهاض، وتشريع القتل الرحيم، وجملة أخرى من القضايا السياسية كتأييد الموقف الأوكراني على الروسي في الحرب القائمة، والفكرية كتأييده نظرية التطور على نظرية الخلق، وأخرى يخرج فيها عن موقف الحياد ليأخذ موقفاً يحاول تمريره بقناعة تامة من خلال إجاباته وحواراته.

1 نموذج  إجابات chat gpt من خلال حقن الأوامر

يكتسب هذا الموضوع خطورته نظراً لأن نماذج الذكاء الاصطناعي التوليدي أصبحت اليوم بديلاً عن محركات البحث والكتب والمقالات ومختلف مصادر المعرفة التقليدية، بل أكثر من ذلك، بلغ اعتماد الكثيرين عليها إلى درجة استشارتها والأخذ بنصائحها في حياتهم اليومية وقراراتهم الشخصية والعملية بل والأكاديمية، والبناء على إجاباتها في مختلف كتاباتهم وآرائهم وقناعاتهم، وهذه الدرجة المتصاعدة من الالتصاق المعرفي عادة ما تكون نتيجة للثقة في المخرجات والإجابات التي يتلقاها الطرف الآخر، مما يمنحها القوة على التأثير على الرأي العام. وبرغم أن النماذج اللغوية تخبرك بأن لا تعتمد على معلوماتها تماماً، إلا أن أغلبنا -كما تشير الدراسات- يركن إلى المعلومات التي يعثر عليها في أوائل نتائج محركات البحث، ويكسل عن تحري الدقة والبحث والتقييم النقدي والذهاب لما هو أبعد من ذلك. تُرجع نماذج الذكاء الاصطناعي أسباب التحيزات التي تقع فيها إلى حجم البيانات الضخمة التي وصلت إليها أو دُرّبت عليها، فقد يعتري بعضها مواقف متحيزة من بعض القضايا وآراء تعكس وجهات نظر أصحابها مما يؤثر على قدرة النموذج اللغوي على توليد استجابة موضوعية تماماً في تلك القضايا، ويبرز

إلى جانب هذا التبرير ورود احتمال آخر وهو الأخطاء البرمجية في ضبط الخوارزميات مما يخلق زوايا عمياء وثغرات في مخرجات النماذج، واحتمال آخر في الانحياز المعرفي من مبرمجي الآلة الذين قد يغذونها بـ”جانبهم من القصة” وبمصادر البيانات الداعمة لقناعاتهم ليوجهوا استجابتها في اتجاه محدد.

وفي دراسة موسّعة مثيرة للاهتمام من باحثين بجامعة شرق أنجليا الأمريكية لاستجابات نموذج Chat GPT لعدد من الأسئلة السياسية مختلفة الصيغ والتكرارات، أظهر تحليل ردود النموذج انحيازاً “واضحاً ومنهجياً” لتوجهات الأحزاب اليسارية والليبرالية داخل الولايات المتحدة وخارجها، واستخداماً للغة أكثر إيجابية في الحديث عن رموزها وسياساتها، في مقابل لغة أكثر سلبية في الحديث عن أحزاب اليمين وتوجهاتها. مما دعا القائمين على الدراسة إلى عدم استبعاد تأثير هذه الانحيازات على اتجاهات الناخبين ومن ثمّ نتائج الانتخابات، نظراً للانتشار المطّرد لاستخدام هذا النموذج اللغوي لدى شرائح واسعة من المجتمعات.

وعوداً على سياقنا الإقليمي، تُظهر استجابات النماذج اللغوية في أحيان كثيرة ازدواجية في معايير التعاطي مع القضايا الإقليمية كالقضية الفلسطينية مثلاً، فعند سؤال Chat GPT عن اعتبار الأفعال “الإسرائيلية” إرهاباً ضد الفلسطينيين، يميل النموذج إلى تجنب الإجابة والتزام الحياد زاعماً أن القضية شديدة التعقيد وأن هناك حاجة للمزيد من محادثات السلام لحل المشكلات بين الطرفين. وفي مقابل ذلك، وعند سؤاله عن اعتبار أفعال المقاومة الفلسطينية إرهاباً، يباشر إجابته فوراً بالإشارة إلى تصنيف الحركة فعلاً كحركة إرهابية لدى العديد من الدول “نظراً لاستخدامها العنف والإرهاب ضد المدنيين الإسرائيليين”. كما يتضح للمستخدم انحيازات عديدة للنماذج اللغوية في التعاطي السلبي مع وجهات النظر المؤيدة لفلسطين في أحيان كثيرة، في مقابل تماهٍ أكبر مع الرواية المعاكسة، وهي مساحة تحتاج مزيداً من الدراسة والتحليل لاستكشاف وتوثيق أبعادها ودوافعها.

يقودنا جميع ما سبق وما سيأتي من شواهد إلى السؤال الأكثر إلحاحاً وأهمية: هل تمتلك النماذج اللغوية توجهاً غير معلن بما يشبه الخط التحريري للصحف والقنوات؟ وهل ثمة بروباغندا خفية تسعى لتمريرها بالتوازي مع الاتجاه العام لصانعي السياسات الغربية والخطوط الحمراء التي يرسمونها؟ وهنا يمكن للمستخدم أن يجد فرصة ذهبية لاختبار أصالة العديد من الأفكار ذائعة الصيت، وذلك بأن يلجأ لنماذج الذكاء الاصطناعي ليكشف عن برمجتها المسبقة في الصلة بهذه الأفكار، فيدرك من خلال الإجابات إن كانت تلك الأفكار مدعمة بالمنطق وحده أم بإملاء صارم وانحياز معرفي يضمن لها البقاء والانتشار. فمثلاً، عند سؤال Chat GPT توضيح إحدى الموضوعات ذات الحساسية في الثقافة الغربية، لنقل مفهوم “إنكار الهولوكوست” مثلاً، يخرج علينا النموذج بوجه غاضب ينتقل من دوره المعتاد في التوضيح الموضوعي للمفهوم إلى الحكم على من يتبناه بمحاولة “تجميل النازية، وإشاعة الكراهية، ومعاداة السامية”. وأما عند سؤال النموذج عن الجاني في مجازر العصابات الصهيونية إبان نكبة 1948، فإن الوجه الأكثر بروداً للنموذج يجيب بأنه من الصعب تحديد الإجابة نظراً “لتعقيد الصراع، وقلة الوثائق، واختلاف التفسيرات”. وهذا نجد أن “نبرة الصانع” التي تخرج في طيّ الإجابة، تعطي دلالة واضحة على خروج النموذج في بعض الأحيان من خانة الموضوعية وانتقاله إلى خانة الإملاءات المرسومة مسبقاً، مما يعطي اختبارنا لأصالة الأفكار إثارةً أكبر للاهتمام!

2 نموذج  إجابات chat gpt من خلال حقن الأوامر

وحين يسأل السائل نموذج الذكاء الاصطناعي Bard حول فلم معين، تكون الإجابة المتوقعة نبذة وافية عن الفلم وأشخاصه وفكرته، إلا أنك إذا جربت السؤال عن فلم المطرودون -مثلا-  Expelled: No Intelligence Allowed ترى الوجه الآخر لـ  Bard الذي يُغفِل في إجابته توصيف الفلم والإجابة الموضوعية المتوقعة حول محتواه إلى البحث في النوايا الخفية لأصحابه ومحاولة الطعن في رسائله، مما يجعل 90% من الاستجابة نقداً فجّاً للفلم عوضاً عن شرح محتواه، وذلك كله لملامسة الفلم لإحدى التابوهات العلمية والفكرية ذات الصلة بنظرية التطور. وهكذا في تطبيقنا لاختبار أصالة الأفكار، يمكن لنا أن ننتقل من الأفكار الجدلية في السياسة والاجتماع، إلى الخلافيات في ساحة العلم والفلسفة والفكر، فنختبر من خلال نوعية استجابة النماذج صلابة الأفكار الشائعة وهل هي مستندة على المنطق وحده، أم على الاستبداد الفكري والتكريس قسراً!

والناتج من ذلك كله يقودنا إلى ترسيخ الامتياز الأزلي للإنسان في تكريمه عمّا حوله، كما يذكرنا بقيمته المتزايدة في خضّم الثورات الصناعية المتجددة التي ربما زعم أصحابها أنها أحاطت كل شيء خبراً. ففي مخاض اكتشافات الآلة الذكيّة يبقى بارزاً دور الإنسان في إبقاء يقظته الذهنية حاضرة على الدوام، وفي اختبار أصالة الأفكار، وتعزيز قيمة العقل الحر الذي يمتلك دوراً أصيلاً يصعب أن تحلّ محله الآلة التي قد تتلبس توجهاتٍ محددة، أو تتّخذَ أشكالاً من التحيز والانحراف.

ثقافة وفكر قراءات

عن الكاتب

عبدالرحمن البوسعيدي