La Sélection Des Gènes Et La Classification Des Données Bio-puces

dc.contributor.authorZERROUGUI, SALMA
dc.contributor.authorMOHAMADI, HADJIRA
dc.date.accessioned2021-12-05T09:08:03Z
dc.date.available2021-12-05T09:08:03Z
dc.date.issued2021
dc.description.abstractتعد تقنية التنقيب عن البيانات أساسية للحصول على المعلومات المفيدة ، وتصنيف السمات واختيارها إلزامي بالإضافة إلى انجاز النماذج المناسبة لاتخاذ قرار جيد بعيدًا عن أي بيانات غير مهمة و متكررة ، ليست ذات صلة ويفضل أن تكون ذات أبعاد صغيرة . Filtre, Wrapper, ( لتنفيذ الخوارزميات من الطرق JAVA المعتمد على WEKA استخدمنا برنامج لعرض النتائج. )Hybride Lungcancer, Lymphography et Tumor بالنسبة لأنظمة إدارة قواعد البيانات ، استخدمنا القواعد Résumé : La technique de fouille de données est primordiale pour l’obtention de l’information utile, la classification et la sélection des attributs sont obligatoires ainsi que la réalisation des modèles adéquats pour la prise d’une bonne décision loin de toute donnée non significative, redondante, non pertinente et avec une petite dimensionnalité. Nous avons utilisé le logiciel WEKA basé sur JAVA comme nous avons expérimenté les algorithmes des méthodes Filtre, Wrapper, Hybride pour diffuser les résultats. Pour les systèmes de gestion de base de données, nous avons utilisé Lungcancer, Lymphography et Tumor. Abstract: The data mining technique is essential for obtaining useful information, the classification and selection of attributes are mandatory as well as the realization of suitable models for making a good decision far from any insignificant, redundant data. , irrelevant and with a small dimensionality. We used the WEKA software based on JAVA as we experimented with the algorithms of the Filter, Wrapper, Hybrid methods to disseminate the results. For the database management systems we used Lungcancer, Lymphography and Tumor.en_US
dc.identifier.issnMM/603
dc.identifier.urihttp://10.10.1.6:4000/handle/123456789/1408
dc.language.isofren_US
dc.publisherUniversité Mohamed el-Bachir el-Ibrahimi Bordj Bou Arréridj Faculté des Mathématiques et Informatiqueen_US
dc.titleLa Sélection Des Gènes Et La Classification Des Données Bio-pucesen_US
dc.typeThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
MEMOIRE MASTER .pdf
Size:
1.77 MB
Format:
Adobe Portable Document Format
Description:
Ce mémoire traite le problème de la classification et de la sélection d’attributs afin de réduire la dimensionnalité des données bio-puces traité en bioinformatique en réservant les données les plus pertinents, les plus explicatifs , non redondants et non cohérés. Dans ce mémoire nous sommes intéressés à la sélection des attributs pour trouver le sous-ensemble optimal parmi un ensemble de données de très grande taille. Nous avons suivi les points suivants : - Une présentation du domaine de la bio-informatique et les données bio-puces. - Une étude détaillée sur la fouille des données et les différents types d’algorithmes de classification supervisée. - Un détail sur les méthodes de sélection d’attributs. Nous avons également testé un échantillon des bases de bases de données, en examinant des algorithmes sur le logiciel Weka. Enfin nous avons fait une comparaison des résultats selon le nombre d’attributs sélectionné et l’occuracy pour chaque algorithme. Notre travail n’est qu’un pas dans le domaine de la sélection d’attributs et les données bio-puces d’ADN pour prédire les cellules saines des cellules cancéreuses. Ainsi nous présentons ici quelques perspectives pour améliorer les travaux de ce mémoire. - Améliorer les méthodes Wrapper, Filter et hybride pour trouver facilement les scores élevés des attributs les plus pertinents. - Développer l’outil Weka pour maitriser des algorithmes qui aident à la prise des décisions. - Améliorer l’outil Weka pour définir directement à quel type de méthode (Wrapper, Filter ou hybride) chaque algorithme. - Enrichir Weka pour l’obtention et la préparation de la base de donnés sans passer par les étapes actuelles. - Essayer de faire un travail collaboratif entre les biologistes et les informaticiens pour la maitrise des données biologiques en vue informatique (base de données informatiques) afin d’effectuer des prédictions qui aident à restreindre la maladie avant son évolution en cancer mortel.

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: