تفكيك خطاب الكراهية: وجهة نظر حاسوبية

استمع لزبدة المقال على منصتنا في الساوند كلاود.


(١) شون ماكافاني وآخرون. جامعة جورج تاون، الولايات المتحدة الامريكية.

(٢) مارتن ساب وآخرون. جامعة كارنيجي ميلون، الولايات المتحدة الامريكية.

(٣) آنا شميدت و مايكل ويجند. جامعة سارلاند، ألمانيا.

(1) MacAvaney, Sean, et al. "Hate speech detection: Challenges and solutions."PloS one14.8 (2019). doi.

(2) Sap, Maarten, et al. "The risk of racial bias in hate speech detection."Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. 2019. link.

(3) Schmidt, Anna, and Michael Wiegand. "A survey on hate speech detection using natural language processing."Proceedings of the Fifth International Workshop on Natural Language Processing for Social Media. 2017. link.


مخطوطة بيد اللواء مسفر الغامدي ( غرد)


تقديم منظور


في مايو الماضي، قام موقع تويتر بحجب تغريدة للرئيس الأمريكي، دونالد ترامب، قائلا إنها "تخالف القواعد التي تمنع تمجيد العنف". كانت هذه التغريدة تعلق على الاضطرابات المندلعة في مدينة مينابوليس على إثر مقتل جورج فلويد الذي هز العالم حيث كتب ترامب:

"when the looting starts, the shooting starts."
"عندما يبدأ النهب ، يبدأ إطلاق النار."

تغريدة ترامب المحجوبة.


استبدل تويتر التغريدة بتحذير من محتوى التغريدة المحرض على العنف، مما حدا بالرئيس الأمريكي للتهديد بإقفال منصات التواصل الاجتماعي، متهما إياها بكبت حرية التعبير. تغريدة ترامب هي واحدة من ملايين التغريدات والمنشورات التي تنضح بها أوعية التواصل الاجتماعي والتي تحمل صيغة ما يسمى بـ "خطاب الكراهية" أو Hate Speech . تتقولب تلك الخطابات في أشكال مختلفة كالخطابات العنصرية وتحقير الأقليات والمهاجرين، الخطابات المثيرة للنعرات القبلية أو المناطقية، خطابات التحيز الجنسي والتمييز ضد المرأة، خطابات التنمر الإلكتروني خصوصا ضد الأطفال والمراهقين، خطابات التطرف الديني والإرهاب، أو خطابات التندرعلى ذوي الإعاقات الجسدية أو المرضى.


تساهم معالجة خطاب الكراهية، خصوصا في وسائل التواصل الاجتماعي، في تعزيز سلامة وشمولية المجتمعات وتساعد في مكافحة العنف ضد الأقليات والمجموعات المهمشة وغيرها من الانتهاكات الخطيرة لحقوق الإنسان. لذلك توجهت الكثير من وسائل التواصل الاجتماعي إلى أتمتة معالجة خطاب الكراهية وحجب المحتويات ذات العلاقة للمساهمة في تحقيق هذا الهدف. وجدنا في منظور الفرصة المناسبة للتحدث عن كيف يقرأ ويصنف ويفكك الحاسوب لغة الكراهية في الفضاء السيبراني حيث اخترنا لكم سلسلة من الأبحاث الحديثة المنشورة في هذا المجال الغض كي نحكي لكم كيف يتم تفكيك خطاب الكراهية من وجهة نظر حاسوبية.



الملخص التنفيذي


الخريطة الذهنية للمقال (غرِّد)


المقدمة


جرائم الكراهية لم تعد أمراً مستغرباُ حيث أصبحت تتصدر عناوين الأخبار بين الفينة والأخرى. تحمل وسائل التواصل الاجتماعي وزر مجمل هذه الجرائم بصور متعددة. إحدى الصور قد تكون مساهمة وسائل التواصل الاجتماعي في تغذية التطرف بكافة اشكاله والذي يمثل المنبع الأساسي الذي يغذي مثل هذه الجرائم. في بعض الحالات، تلعب وسائل التواصل دور المروج المباشر لمثل هذه الجرائم. وحادثة مسجد نيوزيلندا ليست ببعيدة حيث استخدمت خدمة البث المباشر في فيس بوك لبث الهجوم الإرهابي الذي قام به متطرف يميني، وأسفر عن مقتل نحو 50 مسلماً في مدينة "كرايست تشرش" أثناء صلاة الجمعة في مارس ٢٠١٩. ومن أكثر الحالات انتشاراً، كذلك، استخدام وسائل التواصل الاجتماعي للهجوم على الأقليات في أعقاب الجرائم المتطرفة والتغيرات السياسية. مثلاً لوحظ ارتفاع هائل في التغريدات ضد المهاجرين في بريطانيا بعد الخروج من الاتحاد الأوروبي عام ٢٠١٧، والهجوم الإرهابي في لندن ومانشستر عام ٢٠١٨ وكذلك ارتفاع منشورات الكراهية ضد المهاجرين في كافة وسائل التواصل الاجتماعي في أمريكا منذ انتخاب ترامب.


من أهم مبادئ وسائل التواصل الاجتماعي ومنتديات الحوار والنقاش هي ضمان حرية التعبير للأفراد باعتبارها حقا مقدسا من حقوق الإنسان. ولتمكين هذا الحق، منحت هذه المنصات الفرصة للجميع للتعبير عن آرائهم باستخدام هويات صريحة أو مجهولة. لكن كما هو الحال مع الطبيعة البشرية، تظهر دائما تلك النماذج ذات النزعة لإساءة استخدام الحقوق الممنوحة لترويج خطاب الكراهية وتمجيد العنف وإقصاء الآخرين. هذه الشعرة الفاصلة بين حرية التعبير وتجريم خطاب الكراهية ساهمت بشكل كبير في انتشار الخطاب في أوعية الإعلام بسبب عدم تجريمها قانونياً. مثلاً، التعديل الأول في الدستور الأمريكي ينص على التالي: لا تجرم نقابة المحامين الأمريكيين خطاب الكراهية ما لم يدعُ بشكل مباشر للعنف.


في جميع الأحوال، معظم وسائل التواصل الاجتماعي كتويتر وفيسبوك ويوتيوب تعترف بضرر خطاب الكراهية عبر إقرارها سلسلة من السياسات التي تنظم وجود مثل هذا المحتوى على قنواتها. كما تستثمر الملايين في أبحاث أتمتة اكتشاف خطاب الكراهية وتحليله حاسوبياً باستخدام تقنيات معالجة اللغة الطبيعية و تعلم الآلة والذي سيساهم بشكل كبير جدا في حظر وجود هذا المحتوى على الويب. قد يبدو هذا المجال لوهلة أنه أمراً هيناً حيث يمكن للحاسوب اكتشاف الكلمات ذات العلاقة بخطاب الكراهية في المحتوى وبالتالي تتم ازالته. لكن في الواقع، مسألة اكتشاف خطاب الكراهية ليست سهلة على الإطلاق. أولى التعقيدات بشأن ذلك هي تعريف ما يمكن اعتباره خطابً للكراهية حيث تتضارب الكثير من الآراء العلمية حول ذلك، وهذا بالتأكيد يعني أن ما قد يعتبر خطاب الكراهية لدى طرف قد لا يكون كذلك لدى طرف آخر. هذا التضارب للأسف ساهم إلى حد كبير في عرقلة وجود هوية وكينونة موحدة ومعتمدة خطاب الكراهية.


الشكل الشجري التالي يعرض الاختلاف في مثل هذه التعاريف التي تقدمها وسائل التواصل الاجتماعي كتويتر وفيس بوك والدساتير القانونية وكذلك الباحثين في هذا المجال.



تعريفات خطاب الكراهية (غرِّد)

كما هو موضح في الشكل البياني، أحد أشكال التضارب هو الخلاف حول تحديد ضحية خطاب الكراهية الذي قد يكون فردا في بعض التعاريف أو مجموعة في أخرى. وكذلك مدى وضوح هذا الخطاب في اختيار ألفاظ مباشرة ذات دلالة واضحة على الكراهية او ظهوره بأسلوب مبطن غير ظاهري لكنه يحرض على العنف أو يحط من شأن فئة أو يتندر بها. كل ذلك يجعل أتمتة اكتشاف وتصنيف خطاب الكراهية مهمة صعبة وذات تحديات كبيرة (١).



كيف يكتشف الحاسوب خطاب الكراهية؟


يستعرض الباحثون أهم الأنظمة الحاسوبية المستخدمة في اكتشاف وجود خطاب الكراهية في النصوص والتي يمكن تصنيفها إلى طرق بسيطة و طرق متقدمة.


طرق بسيطة | الأنظمة المعتمدة على الكلمات الدلالية لخطاب الكراهية


وهي تعتبر أحد أبسط أشكال الأنظمة والتي تعتمد بشكل كبير على وجود قواميس أو قواعد بيانات تحتوي على أكبر عدد من الكلمات الدلالية لخطاب الكراهية في اللغات الحية. تقوم الأنظمة بتفكيك النصوص المراد اختبارها الى سلسلة من الكلمات، وبعد ذلك تبحث عن هذه الكلمات في تلك القواميس. ويتم بعد ذلك تصنيف النص الى خطاب كراهية في حال تطابق كلمة أو أكثر مع أحد الكلمات الدلالية في تلك القواميس. هذه الأنظمة بالتاكيد سريعة لكن لها عيوب كبيرة والسبب اعتمادها الكلي على مدى وجود الكلمات الدلالية لخطاب الكراهية في النص المراد اختباره، وبالتالي ستفشل في اكتشاف محتوى خطاب الكراهية المعتمد على التلميح دون التصريح بتلك الكلمات. وفي المقابل، يتوقع ان تقوم هذه الانظمة بالعديد من التصنيفات الخاطئة لمحتويات قد تحتوي على كلمات بذيئة ولكنها لا تندرج ضمنيا تحت مسمى خطاب كراهية (١).


رسم توضيحي للطرق البسيطة (غرِّد)



هذه الطريقة تنجح بشكل جيد في اكتشاف خطاب الكراهية مع الأمثلة أدناه:

المصدر


بالمقابل هذه الطريقة لا تنجح مع المثال التالي:

Build that wall!

حيث أن المعنى الحرفي يشير إلى بناء حاجز مادي (جدار)، و مع أخذ السياق السياسي، فإن هذا يُفسر على أنه إدانة لبعض المهاجرين في الولايات المتحدة.


قد تساهم بعض المعلومات الإضافية المستخرجة من منصات التواصل الاجتماعي في تحسين اكتشاف مثل هذا المحتوى. تشمل هذه المعلومات الخصائص الديموغرافية للمغردين (العمر، الجنس الخ)، أماكنهم الجغرافية، توقيت التغريد، والتفاعل مع المغردين الآخرين. وإن كان الباحثون يتعاملون مع مثل هذه المعلومات بحذر شديد لمافيها من خرق لخصوصية مستخدمي شبكات التواصل الاجتماعي وتعريضهم كذلك لاحتمالية وصمهم بالمتعصبين بالخطأ (١). (ملاحظة: تشدد تويتر كثيراً على الغرض من التقديم بطلب لاستخدام واجهة التطبيقات البرمجية API بغرض حماية خصوصية المغردين وعدم تصنيفهم أو تجريمهم بشكل آلي).


طرق متقدمة | الأنظمة المعتمدة على تقنيات تعلم الالة


تعتمد أنظمة التعلم الآلي على عينات من تغريدات تم وسمها مسبقا بشكل يدوي إلى (خطاب كراهية أو ليست خطاب كراهية) بعد مراجعتها من قبل مراجعي المحتوى. بعد ذلك تقوم ببناء مصنف آلي (classifier) وهو برنامج/خوارزمية يتدرب من التغريدات الموسومة لبناء نموذج قادر على اكتشاف خطاب الكراهية في أي تغريدة. تنوعت أشكال النماذج فمنها آلة المتجهات الداعمة Support vector machine والانحدار اللوجستي logistic regression و بايز البسيط Naive Bayes و الشبكات العصبية الترشيحية convolutional neural networks ( ترجمة المصطلحات تمت وفق قاموس موقع نمذجيات).


قبل أن تتم معالجة التغريدات من قبل المصنف الآلي ، لابد أولاً من استخلاص الخصائص (features) الدالة على خطاب الكراهية من التغريدات. هناك أشكال مختلفة لتلك الخصائص، منها تفكيك النص المراد اختباره إلى سلسلة من الكلمات او العبارات يشار لها بـ n-grams. بعد ذلك يتم استخلاص جذور هذه الكلمات لتلافي الاختلافات الصرفية والتي قد تؤثر في شكل الكلمة. يمكن بعد ذلك إنشاء ما يسمى ب "حقيبة الكلمات" او bag-of-words للتغريدة المراد معالجتها. كما يمكن إسناد وزن لكل كلمة في حقيبة الكلمات لتوضيح مدى أهميتها في الجملة عن طريق استخدام tf–idf و هو رقم احصائي يهدف إلى إظهار مدى أهمية كلمة في التغريدة المعطاة بالمقارنة مع الكلمات في جميع التغريدات المستخدمة لتدريب المصنف. ومع تطور تقنيات التعلم العميق أصبح من الشائع استخدام تقنية تضمين الكلمات أو word embedding و هو نوع من أنواع تمثيل الكلمات والذي يسمح للكلمات ذات المعنى المشابه أن يصبح لها تمثيل متشابه كذلك (١). وهنا نشير إلى العرض الذي قدمته الباحثة شريفة الغامدي من جامعة الملك سعود الذي يفصل في هذا الموضوع بشكل ثري.


رسم توضيحي للطرق المتقدمة (غرِّد)


بالإضافة إلى حجب المحتويات المسيئة، يمكن استخدام معالجة خطاب الكراهية في التطبيقات التالية:


أتمتة اكتشاف شبكات المتنمرين


في إطار جهود مكافحة خطاب الكراهية، ظهرت مجموعة من الجهود البحثية التي تركز على الاكتشاف الآلي للمتنمر أو المتطرف الالكتروني وكذلك تحليل شخوص الأفراد المتورطين في مشهد خطاب الكراهية. مثلا، تناول أحد الأبحاث ظاهرة التنمر الإلكتروني في تويتر بحيث يتم استخلاص جميع الأفراد المتضمنين في مشهد هذا التنمر آليا ويشمل ذلك تحديد المتنمر نفسه، الضحية، مساعد المتنمر، المدافع عن الضحية، المعزز للتنمر، والمتداول لتغريدات التنمر نفسها. كما يركز هذا النوع من الأبحاث على تحليل المشهد الديموغرافي لناشري محتوى خطاب الكراهية ودراسة دوافعهم وسلوكهم في مختلف وسائل التواصل الاجتماعي. حتما سيساعد هذا التوجه من إضعاف صوت ناشري خطاب الكراهية في وسائل التواصل الاجتماعي التي كانت سببا رئيسيا في تمكينهم وتسهيل تداول آراءهم (٣).


توقع التغيرات المجتمعية المقلقة


هناك كذلك سلسلة من الأبحاث تهتم بدراسة وتحليل التغيرات في النسبة الإجمالية للمشاركات السلبية المتطرفة على مدى فترة زمنية معينة. يساهم هذا النوع من التحليل في في اكتساب رؤى جديدة حول التغييرات في المزاج العام أو الشخصي. كما قد تنبأ الزيادة الملحوظة في عدد منشورات الكراهية في غضون فترة زمنية قصيرة بحصول تطورات مريبة في المجتمع. مثلا، لوحظ الارتفاع المطرد المفاجئ لخطاب الكراهية المتطرف على تويتر في الساعات الأولى التي تعقب الحوادث الارهابية. بالتالي، يمكن استخدام هذه المعلومات في توفير خطوات استباقية لمواجهة الحوادث المتوقعة مثل العنف العنصري أو الهجمات الإرهابية أو الجرائم الأخرى قبل وقوعها (٣).


تحديات معالجة خطاب الكراهية



١. محدودية بيانات خطاب الكراهية


يحتاج تدريب الحاسوب على اكتشاف خطاب الكراهية إلى بيانات مصنفة ومبوبة لأمثلة خطاب الكراهية من الواقع. وهذا يشكل تحدٍ جديد في هذا المجال نظرا لندرة وجود مثل هذه البيانات، وكذلك حوكمة تصنيفها الى خطاب كراهية نظرا لتضارب التعاريف حول كينونة خطاب الكراهية كما سبق إيضاحه. كما يزيد من تعقيد الأمر مدى موثوقية حكم القائمين على تصنيف هذه البيانات والاتفاق بين آرائهم الشخصية حول ما تعريفهم ما هو بمسيء أو غير مسيء. يشكل تويتر المصدر الأساسي لأغلب هذه البيانات القليلة، مما يجعل تطبيق اكتشاف خطاب الكراهية فعالا على النصوص القصيرة التي تشبه تغريدات توتير (أي لا تتعدى ١٢٠ حرف). ولكن منصات التواصل الاجتماعي الاخرى وكذلك المنتديات تقدم منشورات طويلة قد تشمل حوارات ومناقشات حول مواضيع معينة وذات سياق معقد مما يؤثر في معنى ومفهوم خطاب الكراهية و يزيد من صعوبة اكتشافه وتبويبه. للمزيد من المعلومات حول البيانات المتوفرة يمكنكم الرجوع للأبحاث السابقة (وكذلك هذا المستودع) والتي تقدم أنماط مختلفة من خطاب الكراهية وتشمل التغريدات المعبرة عن الكراهية، المحرضة على العنف، التغريدات العنصرية، التغريدات ذات التحيز الجنسي ضد الإناث، التغريدات المضادة لطائفة دينية محددة، والمروجة للتشدد والتطرف (١). ويسعدنا في منظور الإشارة لجهود الباحثات السعوديات في هذا المجال وهن نهى البادي و مرام الكردي ، وكذلك رغد الشعلان وهند الخليفة.


٢. اعتبار السياق اللغوي ونية صانع المحتوى


اعتبار نية المستخدم وكذلك سياق الحديث عند تصميم أنظمة اكتشاف خطاب الكراهية أمراً مهما. لتوضيح ذلك يستعرض الباحثون هذه الأمثلة.


المثال الأول


كانت المنظمة النازية عظيمة
“the Nazi organization was great.”

الأنظمة الحديثة لاكتشاف خطاب الكراهية ستصنف هذه التغريدة كخطاب كراهية لأنها تدعم منظمة ارهابية. لكن لم تكن نية المغرد تمجيد أيدولوجية هذه المجموعة وإنما الإشارة ضمن السياق إلى قوة تنظيمهم مقارنة بالمجموعات التاريخية الإرهابية الأخرى (١).


المثال الثاني


المتوحشون الهنود والمعروف عنهم نظامهم في الحرب، الخراب الذي لا يميز بين والجنس والظروف.
“. . .The merciless Indian Savages, whose known rule of warfare, is an undistinguished destruction of all ages, sexes and conditions. . .”

لا يختلف اثنان أن هذا المنشور هو مثال صريح لخطاب الكراهية والذي يهين الامريكين الاصليين (الهنود الحمر). ولكن في الواقع، هذا النص ما هو إلا إقتباس من إعلان الاستقلال الأمريكي Declaration of Independence حيث كان تداول مثل هذه الأوصاف ذلك الوقت أمرا مقبولاً. كما لم يكن بنية ناشر هذا البوست على الفيسبوك ترويج الكراهية ضد هذه الفئة انما مجرد الاقتباس من وثيقة تاريخية. وبالتالي يمكن القول إن اعتبار السياق مهم جدا وكذلك اعتبار التغير الزمني لهذا السياق فالمواقف تتغير وتتبدل عبر الزمان، فما كان يعد موقفا مقبولا في زمن ما أصبح اليوم يعد خطاب كراهية، وإن إغفال مثل هذه الاعتبارات سيؤدي إلى حجب كثير من المحتويات ذات العلاقة وكذلك اتهام صانعيها بجنحة خطاب الكراهية (١).


٣. دور الخلفيات الثقافية


أغلب الدراسات المتاحة في أدبيات أتمتة اكتشاف خطاب الكراهية تركز بشكل كبير على اللغة الانجليزية. وفي هذا الموضوع يتشعب أمران، الأمر الأول هو ضرورة دراسة اللغات الاخرى بما فيها اللغة العربية وذلك لأن لخطاب الكراهية تبعات ثقافية قوية، أي اعتمادًا على خلفية ثقافية معينة قد يُنظر إلى المحتوى المراد معالجته على أنه مسيئ أم لا. وبالتالي لا يمكن الاعتماد على اللغة الانجليزية فقط في بناء نماذج تلك الأنظمة والاكتفاء بترجمة المحتويات قبل اختبارها من قبل تلك الانظمة (٣).


الأمر الآخر هو الأخذ في الاعتبار السياق الثقافي عند الاتمتة و يقصد بذلك اللهجات وهويات المستخدمين الثقافية. بعض العبارات المسيئة المتداولة داخل مجتمع معين قد تبدو مقبولة إذا تم استخدامها من أفراد المجتمع ذاته، ولكن حينما يستخدمها غريب عن هذا المجتمع فانه ينظر اليها انها خطاب استنقاص من ذلك المجتمع وبالتالي خطاب كراهية. من الأمثلة التي أوردها الباحثون كلمة “n*gga” وهي أحد الكلمات في اللهجة الانجليزية الامريكية-الافريقية African American English dialect والمتداولة بين أفراد المجتمع الامريكي- الافريقي، خاصة بين فئة الشباب والمراهقين من ذلك المجتمع. ولانها تعتبر لفظة مسيئة في قواميس تلك الانظمة، يتعرض المحتوى الذي تنتجه هذه الفئة على تويتر من الهجوم من قبل أنظمة التعرف على خطاب الكراهية التي لا تعتبر السياق الثقافي لتلك اللهجة عند معالجتها المحتوى. ويعزو الباحثون ظهور هذه المشاكل إلى التحيز العرقي عند إنتاج بيانات تلك الانظمة (٢).


٤. تمويه خطاب الكراهية


ازداد وعي مستخدمي شبكات التواصل الاجتماعي بأتمتة تلك الشبكات لأنظمة اكتشاف خطاب الكراهية، مما حدا بكثير من المستخدمين استخدام سبل ملتوية للتحايل على هذه الأنظمة لتفادي تعليق حساباتهم او الغاء تغريداتهم. مثلا، قامت اغلب شبكات التواصل الاجتماعي بحذف جميع منشورات المشتبه به في أحداث مسجد نيوزيلندا، كما قامت بمنع مشاركتها أو إعادة نشرها من قبل المستخدمين لمنع انتشار رسائل ذلك المتطرف. كحل بديل، قام بعض المستخدمين بتداول تلك المنشورات على شاكلة صور (سكرين شوت) للمنشور الممنوع تداوله وذلك لمعرفتهم أن انظمة مكافحة خطاب الكراهية لن تتمكن من اكتشافها. على الرغم من أنه يمكن استخدام التعرف الضوئي على الحروف (optical character recognition) لحل تلك المشكلة، إلا أن هذا يوضح أن هناك معركة مستمرة بين أولئك الذين يحاولون نشر محتوى يحض على الكراهية وأولئك الذين يحاولون منعه (١).


خاتمة

استعرضنا في هذا المقال سلسلة من الأبحاث المنشورة حديثا من قبل جامعات عريقة في مجال معالجة خطاب الكراهية في وسائل التواصل الاجتماعي. حيث تم تبيان كيف يفكك الحاسوب خطاب الكراهية ويعالجه بطرق بسيطة أو متقدمة وكذلك العقبات في سبيل تقدم هذا المجال البحثي الغض والمهم. نأمل أن يساهم هذا المجال في تطهير وسائل التواصل الاجتماعي من محتوى الكراهية المسموم الذي ينخر في جسد شمولية وسلامة المجتمعات الحديثة.

551 views0 comments

Recent Posts

See All