Le discours de haine sur le web et les médias sociaux

dc.contributor.authorFayssal, Zerargui
dc.contributor.authorOmar, Benzaouii
dc.date.accessioned2022-01-05T08:20:35Z
dc.date.available2022-01-05T08:20:35Z
dc.date.issued2021
dc.description.abstractعلى مدى السنوات القليلة الماضية، ازداد عدد الأشخاص الذين يستخدمون وسائل التواصل الاجتماعي عبر الإنترنت مما أدى إلى توسع غير متوقع لمحتوى الكراهية و العنصرية الذي يستهدف الأشخاص على أساس العرق والجنس والدين وما إلى ذلك . التحليل اليدوي لخطاب الكراهية على وسائل التواصل الاجتماعي غير عملي بسبب الحجم الهائل للبيانات، حيث إنه مكلف ويستغرق وقتًا طويل . لهذا السبب، من المهم اكتشاف وإزالة المحتوى الذي يحض على الكراهي ة عبر الإنترنت عن طريق المعالجة التلقائية لمحتوى المستخدم . في هذا المشروع، نناقش دراسة حالة عملية للكشف التلقائي عن تعليقات الكراهية التي تستهدف بشكل خاص فئة اللجئي ن الأفارقة في الجزائر على المنصة الاجتماعية YouTube باستخدام تقنيات التعلم الآلي والتعلم العميق ومن خلل احترا م منهجية تصنيف النص من مجال المعالجة التلقائية للغة الطبيعية. كلمات مفتاحية: الكراهية ، خطاب الكراهية ، اللجئون الأفارقة ، التعلم الآلي ، التعلم العميق ، تصنيف النص ، المعالجة الآلية للغة الطبيعية. Abstract Over the past few years, the number of people using online social media has exploded leading to an unexpected expansion of hate and racial content that targets people on the basis of their race, gender, religion, etc. Manual analysis of hate speech on social media is impractical due to the sheer volume of data, as it is both expensive and time consuming. For this reason, it is important to detect and remove online hate speech by automatically processing user content. In this project, we discuss a practical case study for the automatic detection of hate comments that specifically target the category of African refugees in Algeria on the social platform YouTube using machine learning and deep learning techniques with respect to the methodology of text categorization resulting from the field of automatic natural language processing. Keywords: hate, hate speech, Africans, machine learning, deep learning, text classification, NLP. Résumé Au cours des dernières années, le nombre de personnes utilisant les réseaux sociaux en ligne a explosé menant à une expansion inattendue du contenu haineux et racial qui cible les personnes sur la base de leurs races, sexes, religions, etc. L’analyse manuelle du discours de haine sur les médias sociaux est peu pratique en raison du volume considérable de données, car cela est à la fois coûteux et laborieux. Pour cette raison, il est important de détecter et de supprimer les discours de haine en ligne en traitant automatiquement le contenu des utilisateurs. Dans ce projet, nous abordons un cas d’étude pratique pour la détection automatique des commentaires haineux qui visent particulièrement la catégorie des réfugiés africains en Algérie sur la plateforme sociale YouTube à l’aide des techniques d’apprentissage automatique et d’apprentissage profond et en respectant la méthodologie de catégorisation de texte issue du domaine de traitement automatique du langage naturel. Mots-clés : haine, discours de haine, haine, Africains, apprentissage automatique, apprentissage approfondi, classification de texte, TALN.en_US
dc.identifier.issnMM/655
dc.identifier.urihttp://10.10.1.6:4000/handle/123456789/1658
dc.language.isofren_US
dc.publisherUniversité Mohamed el-Bachir el-Ibrahimi Bordj Bou Arréridj Faculté de Mathématique et Informatiqueen_US
dc.subject, hate speech, Africans, machine learning, deep learning, text classification, NLP.en_US
dc.titleLe discours de haine sur le web et les médias sociauxen_US
dc.typeThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
HateSpeech_Benzaoui&Zerargui.pdf
Size:
1.56 MB
Format:
Adobe Portable Document Format
Description:
La détection du discours de haine sur les réseaux sociaux à l’aide des techniques d’intelligence artificielle est très importante et efficace pour essayer de réduire ce phénomène qui affecte les gens dans une large mesure car il peut affecter la diffusion d’idées qui incitent à la haine, étant donné que la facilité de communication via les différents réseaux sociaux aide grandement les diffuseurs de haine à diffuser leurs idées librement et sans censure stricte sur certaines plateformes. Malgré les efforts déployés par les plateformes de réseaux sociaux, il y en a qui n’ont pas été en mesure de lutter efficacement contre ce phénomène. Chaque jour, nous remarquons plusieurs publications, commentaires ou autres contenus qui appellent à la haine ou incitent des groupes de la société contre d’autres groupes, et cela contribue à créer une atmosphère propice à ces personnes pour répandre leurs croyances. Les plateformes de médias sociaux ont créé une société parallèle à la société dans laquelle nous vivons, qui se caractérise par du négatif et du positif, et cela nous oblige à être au niveau de ce développement très rapide par l’utilisation des techniques d’apprentissage automatique et d’apprentissage approfondi pour trouver des solutions à tous les phénomènes tels que le discours de haine sur les réseaux sociaux. À la suite de cette recherche, un certain nombre d’avancées ont été faites dans le domaine. Une analyse approfondie des données a d’abord été réalisée pour comprendre le caractère gravement déséquilibré et l’absence de caractéristiques discriminantes dans les ensembles de données typiques auxquels il faut faire face dans de telles situations. D’autre part, afin de collecter des caractéristiques implicites qui pourraient être bénéfiques pour la catégorisation. Une vaste collection d’ensembles de données pour le discours de haine a été utilisée pour tester nos approches, et ils se sont avérés extrêmement efficaces pour détecter et classer le contenu haineux (par opposition à non haineux), dont nous avons montré qu’il était plus difficile et sans doute plus important dans la pratique. Nous espérons que ce travail sera à la hauteur et que l’application que nous avons développée sera efficace pour détecter les discours de haine, et nous espérons également que tous les lecteurs bénéficieront de la compréhension du sujet de la détection des discours de haine sur les réseaux sociaux à travers le travail modeste que nous avons fait.

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: