Analyse des sentiments et modélisation thématique concernant les maladies chroniques

dc.contributor.authorARBOUCHE Massine Issiakhem
dc.contributor.authorADJOUT Lotfi
dc.date.accessioned2023-09-14T09:28:13Z
dc.date.available2023-09-14T09:28:13Z
dc.date.issued2023-06
dc.description.abstractL'objectif principal de ce projet consiste à collecter des informations précieuses sur les sentiments associées aux maladies chroniques afin d'améliorer la compréhension et les soins de santé dans ce domaine spécifique. Pour atteindre cet objectif, deux méthodes d'analyse textuelle ont été utilisées : l'analyse des sentiments et la modélisation thématique. En ce qui concerne l'analyse des sentiments, une analyse approfondie a été réalisée en implémentant plusieurs algorithmes tels que K-Nearest Neighbors (KNN), Support Vector Machines (SVM) et l'algorithme d'arbre de décision en utilisant deux techniques d'extraction de caractéristiques, à savoir Term Frequency-Inverse Document Frequency (TF-IDF) et Bag of Words (BoW), qui ont été combinées respectivement avec des algorithmes de régression logistique et linéaire. De plus, pour analyser efficacement le langage naturel en arabe, trois modèles pré-entraînés adaptés, ArabBert, DziriBert et Cross-lingual Language Model (XLM), ont été utilisés grâce à l'algorithme de transfert d'apprentissage. Les résultats obtenus mettent en évidence la supériorité des modèles de transfert par apprentissage par rapport aux méthodes classiques, en termes de performance. En ce qui concerne la modélisation thématique, les algorithmes Latent Semantic Analysis (LSA), Latent Dirichlet Allocation (LDA) et (Hierarchical Dirichlet Process) HDP ont été utilisés, afin d'identifier et d'analyser les thèmes clés présents dans les données .The main objective of this project is to collect valuable information about the sentiments associated with chronic diseases in order to understand and enhance healthcare in this specific field. To achieve this goal, two methods of text analysis were employed: sentiment analysis and topic modeling. For sentiment analysis, a comprehensive analysis was conducted by implementing several algorithms such as KNN, SVM, and the decision tree algorithm, using two feature extraction techniques, namely TF-IDF and Bag of Words. These techniques were respectively combined with logistic regression and linear regression algorithms. Moreover, to effectively analyze Arabic natural language, three adapted pre-trained models, ArabBert, DziriBert, and XLM, were employed through transfer learning algorithms. The obtained results highlight the superiority of transfer learning models over conventional methods in terms of performance. As for topic modeling, the LSA, LDA, and HDP algorithms were utilized to identify and analyze key themes present in the data.en_US
dc.identifier.issnMM/757
dc.identifier.urihttp://10.10.1.6:4000/handle/123456789/3875
dc.language.isofren_US
dc.subjectAnalyse des sentiments, modélisation thématique, transfert par apprentissage, extraction des caractéristiques, Maladies chroniquesen_US
dc.subjectSentiment analysis, Topic modeling, Transfer learning, Feature extraction, Chronic diseases.en_US
dc.titleAnalyse des sentiments et modélisation thématique concernant les maladies chroniquesen_US
dc.typeThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Analyse des sentiments et modélisation thématique concernant les maladies chroniques.pdf
Size:
1.16 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: