La recherche et la décontamination de séquences contaminées dans un assemblage De Novo par un modèle basé sur la classification supervisée

No Thumbnail Available

Date

2021

Journal Title

Journal ISSN

Volume Title

Publisher

Université de Bordj Bou Arreridj Faculty of Mathematics and Computer Science

Abstract

Le problème traité dans ce mémoire s’inscrit dans le cadre de la décontamination des séquences d’ADN, l’objectif est de concevoir un modèle de décontamination basée sur la classification supervisée. L’approche proposée consiste en une classification (cible ou contaminant) après avoir extrait certains attributs à savoir le groupe d’attributs IMM et K-gram. Après l’étude de performances, les machines à vecteurs supports (SVM) ont été plus performantes que le KNN et les arbres de décision. L’évaluation du modèle est faite à partir des expérimentations sur les séquences issues d’un sequençage à haut débit en utilisant le simulateur MetaSim

Description

Keywords

Décontamination des séquences d’ADN, classification supervisée, SVM, KNN, arbres de décision, K-gram, IMM,sequençage à haut débit, MetaSim.

Citation

Endorsement

Review

Supplemented By

Referenced By