Amélioration de l’algorithme EMMA pour l’extraction des épisodes fréquents
dc.contributor.author | Benahcene Lemya, Lemya | |
dc.contributor.author | Belaifa, Khawla | |
dc.date.accessioned | 2022-01-04T09:18:55Z | |
dc.date.available | 2022-01-04T09:18:55Z | |
dc.date.issued | 2021 | |
dc.identifier.issn | MM/640 | |
dc.identifier.issn | MM/640 | |
dc.identifier.uri | http://10.10.1.6:4000/handle/123456789/1649 | |
dc.language.iso | fr | en_US |
dc.publisher | Université Mohamed el-Bachir el-Ibrahimi Bordj Bou Arréridj Faculté de Mathématique et Informatique | en_US |
dc.title | Amélioration de l’algorithme EMMA pour l’extraction des épisodes fréquents | en_US |
dc.type | Thesis | en_US |
Files
Original bundle
1 - 1 of 1
- Name:
- Mémoire master 2.pdf
- Size:
- 1 MB
- Format:
- Adobe Portable Document Format
- Description:
- A la fin de ce travail de fin d’étude nous avons cherché et découvert un nouveau domaine est la fouille de donnée, et nous avons bien comprendre les problématiques liées aux l’extraction des motifs séquentiels et l’extraction des épisodes fréquents. Dans ce cadre de travail, nous avons étudié et essayé de comprendre et évaluer les performances de quelques algorithmes d’extraction des épisodes fréquents en termes de temps d’exécution et consommation de l’espace mémoire, et pour atteindre notre objectif (étude comparative), nous avons étudié deux algorithmes qui sont EMMA et TKE et obtenus des résultats qui nous a permis de connaitre la déférence entre ces deux algorithmes. Nous pouvons conclure que l'extraction d'épisodes fréquents est une tâche d'exploration de données populaire pour analyser une séquence d'événements. Elle consiste à identifier toutes les sous-séquences d'événements qui apparaissent au moins pendant les minutes de disponibilité. Nous avons remarqué à travers de cette étude que les algorithmes traditionnels ont un problème au niveau du paramètre minsup, car chaque fois que ce paramètre est très haut, les algorithmes peuvent trouver peu des motifs, il est donc possible de perdre des informations très importantes pour l'utilisateur. Si ce paramètre est trop bas, l’exécution prend beaucoup de temps et un espace de stockage élevée, sachant que l'utilisateur ne dispose généralement pas de beaucoup de temps et d'un espace de stockage pour analyser ses données. Cela aurait été bien si nous prenions différents types de séquence de données pour faire notre étude, mais à la fin nous n'en avons pris que deux et avons pris deux tailles différentes de chacun .
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed to upon submission
- Description: