Résumé:
Au cours des dernières décennies, l'utilisation du courrier électronique s'est généralisée, entraînant des spams ou des messages frauduleux. L'intelligence artificielle (IA) et surtout le machine learning est une solution prometteuse pour classer ces messages en deux catégories: les messages (SPAM) et les HAM. Cependant, cette approche de classification montre des performances insatisfaisantes en raison du faible taux de réussite de la classification des messages valides. Pour améliorer cette situation, le deep learning, branche du machine learning, donne des résultats très satisfaisants.
Dans ce travail, nous allons expérimenter les algorithmes les plus utilisés pour la classification de texte ces dernières années et découvrir quel algorithme est le meilleur pour résoudre ce problème
In recent decades, the use of email has become widespread, leading to spam or fraudulent messages. Artificial intelligence (AI) and especially machine learning is a promising solution to classify these messages into two categories: messages (SPAM) and HAM. However, this classification approach shows unsatisfactory performance due to the low success rate of valid message classification. To improve this situation, deep learning, a branch of machine learning, gives very satisfactory results.
In this work, we will experiment with the most used algorithms for text classification in recent years and find out which algorithm is the best to solve this problem.