Dépôt Institutionnel de l'Université BBA

Traiter le problème de déséquilibre de données en apprentissage automatique : le cas de la détection automatique des attitudes envers les rumeurs politiques en ligne

Afficher la notice abrégée

dc.contributor.author M’HAMDI Nassima
dc.contributor.author AMARA Maroua
dc.date.accessioned 2023-10-01T08:18:05Z
dc.date.available 2023-10-01T08:18:05Z
dc.date.issued 2023
dc.identifier.issn MM/768
dc.identifier.uri https://dspace.univ-bba.dz:443/xmlui/handle/123456789/3996
dc.description.abstract Social media plays a crucial role in communication and information sharing in our time. However, the dissemination of data on these platforms poses a major challenge when it comes to distinguishing true from false information. Fake news spreads quickly, causing massive damage by spreading rumors and misinformation. In this project, our main objective was to develop an automatic classification system of attitudes towards online political rumors, taking into account the common challenge of data imbalance in this type of text classification task. We implemented and evaluated different classification approaches, such as set learning, oversampling (text augmentation), cost-aware learning, and single-class learning, to determine the most suitable to our problem. The results obtained highlight the remarkable performance of the oversampling approach compared to other competing approaches, including ensemble learning, cost-sensitive learning, and single-class learning. Les médias sociaux jouent un rôle crucial dans la communication et le partage d'informations à notre époque. Cependant, la diffusion des données sur ces plateformes pose un défi majeur lorsqu'il s'agit de distinguer les informations véridiques des fausses. Les fausses nouvelles se propagent rapidement, causant ainsi des dommages considérables en propageant des rumeurs et des informations erronées. Dans le cadre de ce projet, notre objectif principal était de développer un système de classification automatique des attitudes envers les rumeurs politiques en ligne, en tenant compte du défi commun de déséquilibre des données dans ce type de tâche de classification de texte. Nous avons mis en oeuvre et évalué différentes approches de classification, telles que l'apprentissage par ensemble, le sur-échantillonnage (augmentation de texte), l'apprentissage sensible au coût et l'apprentissage mono-classe, afin de déterminer la plus adaptée à notre problématique. Les résultats obtenus mettent en évidence les performances remarquables de l'approche de sur-échantillonnage par rapport aux autres approches concurrentes, notamment l'apprentissage par ensemble, l’apprentissage sensible au coût, et l'apprentissage mono-classe. en_US
dc.language.iso fr en_US
dc.publisher UNIVERSITY BBA en_US
dc.subject fausses nouvelles, rumeurs, classification automatique, classification de texte, déséquilibre des données, apprentissage par ensemble, apprentissage sensible au coût, apprentissage mono-classe, apprentissage sur-échantillonnage. en_US
dc.subject fake news, rumors, automatic classification, text classification, data imbalance, ensemble learning, cost-sensitive learning, single-class learning, oversampling learning en_US
dc.subject الأخبار الكاذبة، الشائعات، التصنيف الآلي، تصنيف النص، عدم توازن البيانات، التعلم الجماعي، التعلم الحساس للتكلفة، التعلم الفردي، التعلم المفرط. en_US
dc.title Traiter le problème de déséquilibre de données en apprentissage automatique : le cas de la détection automatique des attitudes envers les rumeurs politiques en ligne en_US
dc.type Thesis en_US


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Parcourir

Mon compte