Classification du diabète avec l’algorithme KNN
dc.contributor.author | Zouache, hanen | |
dc.contributor.author | Bendib, ichrak | |
dc.date.accessioned | 2022-01-05T07:51:35Z | |
dc.date.available | 2022-01-05T07:51:35Z | |
dc.date.issued | 2021 | |
dc.description.abstract | Le diabète est l'un des principaux problèmes de santé mondiaux. Selon le rapport de l'OMS 2011, environ 346 millions de personnes dans le monde souffrent de diabète sucré. Le diabète sucré est une maladie métabolique dans laquelle une mauvaise gestion de la glycémie entraîne le risque de nombreuses maladies comme la crise cardiaque, la maladie rénale et l'insuffisance rénale. Dans ce mémoire, nous diagnostiquons le diabète sucré à l'aide de l'algorithme du voisin le plus proche, dans lequel plusieurs paramètres ont été testés tels que le nombre de voisin (k) ainsi que les mesures de distances ou de similarités. Dans l’autre côté, une étude comparative est accompagnée de différents algorithmes de classification d’apprentissage supervisé sur les données de ‘Pima indian diabetes database. Les résultats de performances ont montré clairement l’avance de l’algorithme KNN contre tous les autres algorithmes choisis dans cette étude. Abstract Diabetes is one of the world's major health problems. According to the WHO 2011 report, around 346 million people worldwide have diabetes mellitus. Diabetes mellitus is a metabolic disease in which poor blood sugar management puts you at risk for many diseases like heart attack, kidney disease, and kidney failure. In this Master dissertation, we diagnose diabetes mellitus using the nearest neighbour algorithm, in which several parameters were tested such as neighbour number (k) as well as distance or similarity measurements. On the other hand, a comparative study is accompanied by different supervised learning classification algorithms on data from the ‘Pima indian diabetes’ database. The performance results obviously showed the advance of the KNN algorithm against all other algorithms chosen in this study. ملخص مرض السكري هو أحد المشاكل الصحية العالمية الكبرى. حسب تقرير منظمة الصحة العالمية لعام 2011 ، يعاني حوالي 346 مليون شخص في جميع أنحاء العالم من مرض السكري. داء ا لسكري هو عبارة عن اضطراب في هرمون الأنسولين الذي ينتجه البنكرياس لمساعدة الجسم في استخدام السكر والدهون وتخزين بعضها مما يؤدي الى الإصابة بالعديد من الأمراض مثل النوبات القلبية وأمراض الكلى والفشل الكلوي .يمكن أن تكون تقنيات التعلم الآلي (MLTs) حلا للتشخيص المبكر والتنبؤ بمرض السكري. يعد التعلم الآلي (machine Learning) جانبًا من جوانب الذكاء الاصطناعي بحيث يتم استخدامه للتنبؤ بالمرض في المراحل المبكرة. في هذه المذكرة سوف نقوم بتشخيص داء السكري باستخدام خوارزمية أقرب الجيران KNN ، حيث تم اختبار العديد من المتغيرات مثل عدد الجار (k) وقياس المسافات. و في Résumé الجانب الآخر ، ستكون الدراسة للمقارنة بين خوارزميات التصنيف ) Random Forest,KNN ، Support Vector Machine ، Naïves Bayes ) على قاعدة بيانات Pima indian diabète ، واستنتاج افضل خوارزمية الي تفي بهذا الغرض اين أظهرت نتائج الدراسة بوضوح ان خوارزمية KNN هي الاحسن مقابل جميع الخوارزميات الأخرى المختارة في هذه الدراسة | en_US |
dc.identifier.issn | MM/658 | |
dc.identifier.uri | http://10.10.1.6:4000/handle/123456789/1655 | |
dc.language.iso | fr | en_US |
dc.publisher | Université Mohamed el-Bachir el-Ibrahimi Bordj Bou Arréridj Faculté de Mathématique et Informatique | en_US |
dc.subject | Classification . l’algorithme KNN | en_US |
dc.title | Classification du diabète avec l’algorithme KNN | en_US |
dc.type | Thesis | en_US |
Files
Original bundle
1 - 1 of 1
- Name:
- مذكرة تخرج ماستر2 اعلام الي 2021.pdf
- Size:
- 1.43 MB
- Format:
- Adobe Portable Document Format
- Description:
- Le diabète est l'un des problèmes de santé majeurs dans le monde. Selon le rapport de l'OMS 2011, environ 346 millions de personnes dans le monde souffrent de diabète sucré. Un diagnostic plus précoce évite de nombreuses complications qui peuvent surviennent identification ici en Algérie la prévalence estimée à 14.4% d’après SANOFI qui est une partenaire de santé des patients algérienne. Une prédiction plus précoce évitera des complications de cette maladie. L’approche d’apprentissage automatique résoudre ce problème critique dans le but de cette étude pour construire un modèle capable de prédire si les personnes sont diabétiques des classificateurs. Dans ce mémoire nous avons choisi l’algorithme KNN Comme classificateur dans lequel plusieurs paramètres tels que le nombre de voisin (k) et les mesures de distances ou de similarités ont étaient testés dans cette étude. Les résultats ont montré que plus le paramètre k n’augmente, plus le taux de mesures de précision, rappel et F mesure augmentent également. Le meilleur score est enregistré au niveau de k=11. Les distances euclidien et Minkowski comme des métriques les plus optimales et qui fonctionne mieux pour notre ensemble de données en raison de sa grande précision et score de rappel. En plus, une comparaison est accompagnée comportant l’algorithme KN contre différents algorithmes de classification d’apprentissage supervisé tel que : les arbres de décision, forêt aléatoire, machine à vecteurs de support, Naïves Bayes sur les données ‘Pima indian diabetes database’. Les résultats de performances ont montré clairement l’avance de l’algorithme KNN contre tous les autres algorithmes choisis dans cette étude. Pour les travaux futurs, plusieurs pistes peuvent être explorées. On peut appliquer la même expérimentation sur d’autres bases de données de diabète ou même de type différents pour confirmer les résultats obtenus. Améliorer l’algorithme KNN pour avoir de meilleurs résultats en termes de précision et rappel. Une autre alternative est de tester la réduction de dimension sur le problème de détection de diabète
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed to upon submission
- Description: