Catégorisation multi-étiquette des textes arabes

Thumbnail Image

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

university of bordj bou arreridj

Abstract

Ce mémoire porte sur la classification multi-étiquettes des textes arabes à l’aide de techniques d’apprentissage profond. La langue arabe présente plusieurs défis, notamment une complexité morphologique élevée, une richesse lexicale importante et une grande variabilité dialectale. Ce travail se concentre sur l’utilisation de réseaux de neurones profonds, en particulier le modèle convolutionnel (CNN), BiLSTM et le modèle pré-entraîné AraBERT, afin d’améliorer la précision du classement. Le mémoire aborde les étapes clés du traitement automatique de la langue arabe, les méthodes de représentation des textes, ainsi que les métriques d’évaluation adaptées à la classification multi-étiquettes. Une attention particulière est portée à l’apprentissage par transfert, qui permet de tirer parti de la puissance des modèles linguistiques pré-entraînés pour la langue arabe

Description

Keywords

Classification multi-étiquettes, Textes arabes, Apprentissage profond, Apprentissage par transfert

Citation

Endorsement

Review

Supplemented By

Referenced By