Manipulation des données multilingues dans l'analyse des sentiments

DEBAB, Wafa; DJERBOA, Zohra

Manipulation des données multilingues dans l'analyse des sentiments

dc.contributor.author	DEBAB, Wafa
dc.contributor.author	DJERBOA, Zohra
dc.date.accessioned	2024-09-23T09:59:19Z
dc.date.available	2024-09-23T09:59:19Z
dc.date.issued	2024
dc.description.abstract	This end-of-studies project focuses on the effective management of the large volume of multilingual consumer comments and reviews for companies and project leaders. Based on sentiment analysis and text mining, the study explores different approaches, such as neural networks, SVMs, logistic regression, Bayes Naive, decision trees and random forests, to process data in French and English. A detailed comparison of these methods is made to determine the most suitable for sentiment analysis and multilingual text mining. In addition, two distinct scanning methods, tf-idf and one-hot vector coding, are being tested to assess their effectiveness in analyzing multilingual data	en_US
dc.identifier.issn	MM/828
dc.identifier.uri	http://10.10.1.6:4000/handle/123456789/5438
dc.language.iso	fr	en_US
dc.publisher	UNIVERSITY BBA	en_US
dc.subject	Fouille de texte, analyse de sentiments, réseaux neuronaux, classification, comparaison, prédiction, données multilingue.	en_US
dc.subject	Text mining, sentiment analysis, neural networks, classification, comparison, prediction, multilingual data	en_US
dc.title	Manipulation des données multilingues dans l'analyse des sentiments	en_US
dc.type	Thesis	en_US

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Rapport_fin_etude debab_djerboa .pdf
Size:: 2.87 MB
Format:: Adobe Portable Document Format
Description:: Dans le contexte numérique contemporain, marqué par des échanges et des interactions à l'échelle mondiale, la manipulation de données multilingues combinée à l'analyse des sentiments est devenue essentielle pour appréhender les opinions et les réactions des individus à travers le globe. Ce travail de recherche a examiné diverses méthodes de classification telles que le Réseau neuronal , SVM ,Régression logistique , Naïve de Bayes , Arbre de décision ,et les forêts aléatoires, ainsi que deux approches de vectorisation, TF-IDF et One-Hot vecteur, pour analyser des données provenant de la plateforme Amazon. Les résultats obtenus ont révélé que malgré les différences entre ces techniques, elles ont généré des performances comparables dans la classification de ces données. Cette observation suggère que la sélection de la méthode de classification et de vectorisation peut être adaptée en fonction des besoins spécifiques du projet sans compromettre significativement les performances. De plus, cette étude souligne l'importance d'explorer et de comparer différentes approches pour obtenir des résultats robustes et fiables dans le traitement des données de grande taille et variées, telles que celles provenant d'Amazon. Ces résultats offrent des perspectives précieuses pour les praticiens et les chercheurs dans le domaine de l'apprentissage automatique et de l'analyse de données, en mettant en lumière les options disponibles pour traiter efficacement les données de commerce électronique à grande échelle. Grâce à ces méthodes, les chercheurs et les entreprises peuvent mieux comprendre les opinions et les attitudes des utilisateurs à partir de différentes sources de données textuelles, ce qui facilite la prise de décisions éclairées et l'adaptation des stratégies en conséquence. Perspectives et travaux futurs : En ce qui concerne les perspectives et les travaux futurs, plusieurs pistes peuvent être envisagées. Tout d'abord, une approche intéressante aurait été d'explorer l'utilisation d'un petit ensemble de données en comparaison avec le vaste ensemble de données consulté. Cette démarche aurait permis d'observer comment les méthodes étudiées interagissent avec la quantité d'informations disponibles, offrant ainsi des insights précieux sur l'efficacité des différentes approches dans des contextes de données variés.

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed to upon submission
Description:

Download

Collections

Master Informatique