Résumé:
على مدى السنوات القليلة الماضية، ازداد عدد الأشخاص الذين يستخدمون وسائل التواصل الاجتماعي عبر الإنترنت مما
أدى إلى توسع غير متوقع لمحتوى الكراهية و العنصرية الذي يستهدف الأشخاص على أساس العرق والجنس والدين وما
إلى ذلك .
التحليل اليدوي لخطاب الكراهية على وسائل التواصل الاجتماعي غير عملي بسبب الحجم الهائل للبيانات، حيث إنه مكلف
ويستغرق وقتًا طويل . لهذا السبب، من المهم اكتشاف وإزالة المحتوى الذي يحض على الكراهي ة عبر الإنترنت عن طريق
المعالجة التلقائية لمحتوى المستخدم .
في هذا المشروع، نناقش دراسة حالة عملية للكشف التلقائي عن تعليقات الكراهية التي تستهدف بشكل خاص فئة اللجئي ن
الأفارقة في الجزائر على المنصة الاجتماعية YouTube باستخدام تقنيات التعلم الآلي والتعلم العميق ومن خلل احترا م
منهجية تصنيف النص من مجال المعالجة التلقائية للغة الطبيعية.
كلمات مفتاحية: الكراهية ، خطاب الكراهية ، اللجئون الأفارقة ، التعلم الآلي ، التعلم العميق ، تصنيف النص ، المعالجة
الآلية للغة الطبيعية.
Abstract
Over the past few years, the number of people using online social media has exploded leading to an unexpected expansion of hate and racial content that targets people on the basis of their race, gender, religion, etc.
Manual analysis of hate speech on social media is impractical due to the sheer volume of data, as it is both expensive and time consuming. For this reason, it is important to detect and remove online hate speech by automatically processing user content.
In this project, we discuss a practical case study for the automatic detection of hate comments that specifically target the category of African refugees in Algeria on the social platform YouTube using machine learning and deep learning techniques with respect to the methodology of text categorization resulting from the field of automatic natural language processing.
Keywords: hate, hate speech, Africans, machine learning, deep learning, text classification, NLP.
Résumé
Au cours des dernières années, le nombre de personnes utilisant les réseaux sociaux en ligne a explosé menant à une expansion inattendue du contenu haineux et racial qui cible les personnes sur la base de leurs races, sexes, religions, etc.
L’analyse manuelle du discours de haine sur les médias sociaux est peu pratique en raison du volume considérable de données, car cela est à la fois coûteux et laborieux. Pour cette raison, il est important de détecter et de supprimer les discours de haine en ligne en traitant automatiquement le contenu des utilisateurs.
Dans ce projet, nous abordons un cas d’étude pratique pour la détection automatique des commentaires haineux qui visent particulièrement la catégorie des réfugiés africains en Algérie sur la plateforme sociale YouTube à l’aide des techniques d’apprentissage automatique et d’apprentissage profond et en respectant la méthodologie de catégorisation de texte issue du domaine de traitement automatique du langage naturel.
Mots-clés : haine, discours de haine, haine, Africains, apprentissage automatique, apprentissage approfondi, classification de texte, TALN.