La recherche et la décontamination de séquences contaminées dans un assemblage De Novo par un modèle basé sur la classification supervisée
No Thumbnail Available
Date
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université de Bordj Bou Arreridj Faculty of Mathematics and Computer Science
Abstract
Le problème traité dans ce mémoire s’inscrit dans le cadre de la décontamination des séquences
d’ADN, l’objectif est de concevoir un modèle de décontamination basée sur la classification
supervisée. L’approche proposée consiste en une classification (cible ou contaminant) après
avoir extrait certains attributs à savoir le groupe d’attributs IMM et K-gram. Après l’étude de
performances, les machines à vecteurs supports (SVM) ont été plus performantes que le KNN
et les arbres de décision. L’évaluation du modèle est faite à partir des expérimentations sur les
séquences issues d’un sequençage à haut débit en utilisant le simulateur MetaSim
Description
Keywords
Décontamination des séquences d’ADN, classification supervisée, SVM, KNN, arbres de décision, K-gram, IMM,sequençage à haut débit, MetaSim.