Catégorisation multi-étiquette des textes arabes
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
university of bordj bou arreridj
Abstract
Ce mémoire porte sur la classification multi-étiquettes des textes arabes à l’aide de
techniques d’apprentissage profond. La langue arabe présente plusieurs défis, notamment
une complexité morphologique élevée, une richesse lexicale importante et une grande
variabilité dialectale. Ce travail se concentre sur l’utilisation de réseaux de neurones
profonds, en particulier le modèle convolutionnel (CNN), BiLSTM et le modèle pré-entraîné
AraBERT, afin d’améliorer la précision du classement.
Le mémoire aborde les étapes clés du traitement automatique de la langue arabe, les
méthodes de représentation des textes, ainsi que les métriques d’évaluation adaptées à la
classification multi-étiquettes. Une attention particulière est portée à l’apprentissage par
transfert, qui permet de tirer parti de la puissance des modèles linguistiques pré-entraînés
pour la langue arabe
Description
Keywords
Classification multi-étiquettes, Textes arabes, Apprentissage profond, Apprentissage par transfert