Manipulation des données multilingues dans l'analyse des sentiments
dc.contributor.author | DEBAB, Wafa | |
dc.contributor.author | DJERBOA, Zohra | |
dc.date.accessioned | 2024-09-23T09:59:19Z | |
dc.date.available | 2024-09-23T09:59:19Z | |
dc.date.issued | 2024 | |
dc.description.abstract | This end-of-studies project focuses on the effective management of the large volume of multilingual consumer comments and reviews for companies and project leaders. Based on sentiment analysis and text mining, the study explores different approaches, such as neural networks, SVMs, logistic regression, Bayes Naive, decision trees and random forests, to process data in French and English. A detailed comparison of these methods is made to determine the most suitable for sentiment analysis and multilingual text mining. In addition, two distinct scanning methods, tf-idf and one-hot vector coding, are being tested to assess their effectiveness in analyzing multilingual data | en_US |
dc.identifier.issn | MM/828 | |
dc.identifier.uri | http://10.10.1.6:4000/handle/123456789/5438 | |
dc.language.iso | fr | en_US |
dc.publisher | UNIVERSITY BBA | en_US |
dc.subject | Fouille de texte, analyse de sentiments, réseaux neuronaux, classification, comparaison, prédiction, données multilingue. | en_US |
dc.subject | Text mining, sentiment analysis, neural networks, classification, comparison, prediction, multilingual data | en_US |
dc.title | Manipulation des données multilingues dans l'analyse des sentiments | en_US |
dc.type | Thesis | en_US |
Files
Original bundle
1 - 1 of 1
- Name:
- Rapport_fin_etude debab_djerboa .pdf
- Size:
- 2.87 MB
- Format:
- Adobe Portable Document Format
- Description:
- Dans le contexte numérique contemporain, marqué par des échanges et des interactions à l'échelle mondiale, la manipulation de données multilingues combinée à l'analyse des sentiments est devenue essentielle pour appréhender les opinions et les réactions des individus à travers le globe. Ce travail de recherche a examiné diverses méthodes de classification telles que le Réseau neuronal , SVM ,Régression logistique , Naïve de Bayes , Arbre de décision ,et les forêts aléatoires, ainsi que deux approches de vectorisation, TF-IDF et One-Hot vecteur, pour analyser des données provenant de la plateforme Amazon. Les résultats obtenus ont révélé que malgré les différences entre ces techniques, elles ont généré des performances comparables dans la classification de ces données. Cette observation suggère que la sélection de la méthode de classification et de vectorisation peut être adaptée en fonction des besoins spécifiques du projet sans compromettre significativement les performances. De plus, cette étude souligne l'importance d'explorer et de comparer différentes approches pour obtenir des résultats robustes et fiables dans le traitement des données de grande taille et variées, telles que celles provenant d'Amazon. Ces résultats offrent des perspectives précieuses pour les praticiens et les chercheurs dans le domaine de l'apprentissage automatique et de l'analyse de données, en mettant en lumière les options disponibles pour traiter efficacement les données de commerce électronique à grande échelle. Grâce à ces méthodes, les chercheurs et les entreprises peuvent mieux comprendre les opinions et les attitudes des utilisateurs à partir de différentes sources de données textuelles, ce qui facilite la prise de décisions éclairées et l'adaptation des stratégies en conséquence. Perspectives et travaux futurs : En ce qui concerne les perspectives et les travaux futurs, plusieurs pistes peuvent être envisagées. Tout d'abord, une approche intéressante aurait été d'explorer l'utilisation d'un petit ensemble de données en comparaison avec le vaste ensemble de données consulté. Cette démarche aurait permis d'observer comment les méthodes étudiées interagissent avec la quantité d'informations disponibles, offrant ainsi des insights précieux sur l'efficacité des différentes approches dans des contextes de données variés.
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed to upon submission
- Description: