Résumé:
Les masses de données textuelles aujourd’hui disponibles engendrent un problème difficile
pour les traiter. Dans ce cadre, des méthodes de Fouille de Texte (Text Mining) sont nécessaires
pour extraire les connaissances à partir des textes.
Notre travail consiste à étudier l’une des méthodes d’extraction des connaissances, ou on
traite le corpus textuel puis extrait les motifs fréquents pour générer les règles d’association entre
les concepts avec leurs supports et leurs confiances à l’aide de l’algorithme APRIORI.
Nous avons finalisé ce mémoire par l’implémentation de cet algorithme, l’évaluation des
exemples et la discussion des résultats.
Les mots clés : Fouille de texte, Text Mining, connaissances, corpus textuel, motifs
fréquents, règles d’association, support, confiance, APRIORI.
Abstract
The masses of textual data available today create a difficult problem to process. In this
context, Text Mining methods are necessary to extract knowledge from texts.
Our work consists in studying one of the knowledge extraction methods, where we process
the textual corpus then extract the frequent patterns to generate the association rules between the
concepts with their supports and their confidences using the APRIORI algorithm.
We finalized this dissertation by implementing this algorithm, evaluating the examples and
discussing the results.
Keywords: Text Mining, knowledge, textual corpus, frequent patterns, association rules,
support, confidence, APRIORI.