Manipulation des données multilingues dans l'analyse des sentiments

dc.contributor.authorDEBAB, Wafa
dc.contributor.authorDJERBOA, Zohra
dc.date.accessioned2024-09-23T09:59:19Z
dc.date.available2024-09-23T09:59:19Z
dc.date.issued2024
dc.description.abstractThis end-of-studies project focuses on the effective management of the large volume of multilingual consumer comments and reviews for companies and project leaders. Based on sentiment analysis and text mining, the study explores different approaches, such as neural networks, SVMs, logistic regression, Bayes Naive, decision trees and random forests, to process data in French and English. A detailed comparison of these methods is made to determine the most suitable for sentiment analysis and multilingual text mining. In addition, two distinct scanning methods, tf-idf and one-hot vector coding, are being tested to assess their effectiveness in analyzing multilingual dataen_US
dc.identifier.issnMM/828
dc.identifier.urihttp://10.10.1.6:4000/handle/123456789/5438
dc.language.isofren_US
dc.publisherUNIVERSITY BBAen_US
dc.subjectFouille de texte, analyse de sentiments, réseaux neuronaux, classification, comparaison, prédiction, données multilingue.en_US
dc.subjectText mining, sentiment analysis, neural networks, classification, comparison, prediction, multilingual dataen_US
dc.titleManipulation des données multilingues dans l'analyse des sentimentsen_US
dc.typeThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Rapport_fin_etude debab_djerboa .pdf
Size:
2.87 MB
Format:
Adobe Portable Document Format
Description:
Dans le contexte numérique contemporain, marqué par des échanges et des interactions à l'échelle mondiale, la manipulation de données multilingues combinée à l'analyse des sentiments est devenue essentielle pour appréhender les opinions et les réactions des individus à travers le globe. Ce travail de recherche a examiné diverses méthodes de classification telles que le Réseau neuronal , SVM ,Régression logistique , Naïve de Bayes , Arbre de décision ,et les forêts aléatoires, ainsi que deux approches de vectorisation, TF-IDF et One-Hot vecteur, pour analyser des données provenant de la plateforme Amazon. Les résultats obtenus ont révélé que malgré les différences entre ces techniques, elles ont généré des performances comparables dans la classification de ces données. Cette observation suggère que la sélection de la méthode de classification et de vectorisation peut être adaptée en fonction des besoins spécifiques du projet sans compromettre significativement les performances. De plus, cette étude souligne l'importance d'explorer et de comparer différentes approches pour obtenir des résultats robustes et fiables dans le traitement des données de grande taille et variées, telles que celles provenant d'Amazon. Ces résultats offrent des perspectives précieuses pour les praticiens et les chercheurs dans le domaine de l'apprentissage automatique et de l'analyse de données, en mettant en lumière les options disponibles pour traiter efficacement les données de commerce électronique à grande échelle. Grâce à ces méthodes, les chercheurs et les entreprises peuvent mieux comprendre les opinions et les attitudes des utilisateurs à partir de différentes sources de données textuelles, ce qui facilite la prise de décisions éclairées et l'adaptation des stratégies en conséquence. Perspectives et travaux futurs : En ce qui concerne les perspectives et les travaux futurs, plusieurs pistes peuvent être envisagées. Tout d'abord, une approche intéressante aurait été d'explorer l'utilisation d'un petit ensemble de données en comparaison avec le vaste ensemble de données consulté. Cette démarche aurait permis d'observer comment les méthodes étudiées interagissent avec la quantité d'informations disponibles, offrant ainsi des insights précieux sur l'efficacité des différentes approches dans des contextes de données variés.

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: