Extraction des règles d’association à partir des textes en utilisant la mesure TF-IDF

dc.contributor.authorNebbache, Khaled
dc.contributor.authorRouabah, Abdelbasset
dc.date.accessioned2022-02-22T12:59:30Z
dc.date.available2022-02-22T12:59:30Z
dc.date.issued2021
dc.description.abstractLes masses de données textuelles aujourd’hui disponibles engendrent un problème difficile pour les traiter. Dans ce cadre, des méthodes de Fouille de Texte (Text Mining) sont nécessaires pour extraire les connaissances à partir des textes. Notre travail consiste à étudier l’une des méthodes d’extraction des connaissances, ou on traite le corpus textuel puis extrait les motifs fréquents pour générer les règles d’association entre les concepts avec leurs supports et leurs confiances à l’aide de l’algorithme APRIORI. Nous avons finalisé ce mémoire par l’implémentation de cet algorithme, l’évaluation des exemples et la discussion des résultats. Les mots clés : Fouille de texte, Text Mining, connaissances, corpus textuel, motifs fréquents, règles d’association, support, confiance, APRIORI. Abstract The masses of textual data available today create a difficult problem to process. In this context, Text Mining methods are necessary to extract knowledge from texts. Our work consists in studying one of the knowledge extraction methods, where we process the textual corpus then extract the frequent patterns to generate the association rules between the concepts with their supports and their confidences using the APRIORI algorithm. We finalized this dissertation by implementing this algorithm, evaluating the examples and discussing the results. Keywords: Text Mining, knowledge, textual corpus, frequent patterns, association rules, support, confidence, APRIORI.en_US
dc.identifier.issnMM/556
dc.identifier.urihttp://10.10.1.6:4000/handle/123456789/1899
dc.language.isofren_US
dc.publisherUniversité Mohamed el-Bachir el-Ibrahimi Bordj Bou Arréridj Faculté de Mathématique et Informatiqueen_US
dc.subjectالتنقيب عن النص، المعرفة، مجموعة النصوص، الأنماط المتكررة، قواعد الارتباط، . APRIORI ،confidence ،supporten_US
dc.subjectText Mining, knowledge, textual corpus, frequent patterns, association rules, support, confidence, APRIORIen_US
dc.subjectFouille de texte, Text Mining, connaissances, corpus textuel, motifs fréquents, règles d’association, support, confiance, APRIORIen_US
dc.titleExtraction des règles d’association à partir des textes en utilisant la mesure TF-IDFen_US
dc.typeThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Memoire 2020.pdf
Size:
3.22 MB
Format:
Adobe Portable Document Format
Description:
Les travaux présentés dans ce mémoire ont porté sur l’extraction des connaissances à partir des textes. Au cours de ce travail on a tout d’abord présenté un état de l’art qui explique brièvement le concept de Fouille de texte (Text Mining) en précisant le processus, les techniques et les domaines d’application de ce dernier. On a choisi l’un des méthodes qui est l’extraction des règles d’association. Puis, on a présenté le concept de notre travail en expliquant le fonctionnement des algorithmes qui permettent la recherche des motifs fréquents et la génération des règles d’association valides entre les concepts à l’aide de l’algorithme Apriori. Finalement, on a présenté l’application en exécutant notre code python de l’algorithme APRIORI. On a aussi fait des expérimentations pour extraire les règles d’association à partir des bases textuelles dans différents domaines. Malheureusement, le temps attribué à ce travail a passé rapidement, d’où il était difficile d’enrichir notre travail et étudier d’autres approches et algorithmes. Nous proposons comme perspectives :  Appliquer d’autres méthodes de l’extraction de connaissances à partir des textes.  Tester d’autres algorithmes de génération des règles d’association tels que : FPGROWTH, ECLAT et CLOSE ensuite comparer les résultats avec APRIORI.

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: