Résumé:
Ce mémoire présente une application d'extraction de règles d'association à partir de données textuelles en utilisant deux méthodes. La première méthode utilise l'algorithme traditionnel Apriori avec CountVectorizer. La deuxième méthode combine TF-IDF avec les algorithmes Apriori et FP-Growth pour donner la priorité aux termes importants. Des évaluations expérimentales sont réalisées pour comparer l'efficacité de ces méthodes dans l'extraction de règles d'association. Les résultats sont analysés et discutés, en fournissant des aperçus sur les performances de chaque approche.
This memory presents an application of extracting association rules from textual data using two methods. The first method utilizes the traditional Apriori algorithm with CountVectorizer. The second method combines TF-IDF with the Apriori and FP-Growth algorithms to prioritize important terms. Experimental evaluations are conducted to compare the effectiveness of memory methods in extracting association rules. The results are analyzed and discussed, providing insights into the performance of each approach.
هذه المذكرة تقدم تطبيقًا لاستخراج قواعد الارتباط من البيانات النصية باستخدام طريقتين. تستخدم الطريقة
الأولى خوارزمية Apriori التقليدية بواسطة CountVectorizer . تجمع الطريقة الثانية بين TF-IDF
وخوارزميات Apriori و FP-Growth لإعطاء الأولوية للمصطلحات المهمة. يتم إجراء تقييمات تجريبية
لمقارنة فعالية هذه الطرق في استخراج قواعد الارتباط. يتم تحليل ومناقشة النتائج، وتوفير رؤى حول أداء كل
نهج.