IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBORS (KNN) UNTUK PREDIKSI PENYAKIT DIABETES PADA PEREMPUAN
Keywords:
data mining, rapidminer, kkn, prediksi diabetesAbstract
Diabetes melitus adalah penyakit kronis yang dapat menyebabkan komplikasi serius seperti gagal ginjal, kebutaan, dan penyakit jantung. Deteksi dini risiko diabetes sangat penting untuk mencegah komplikasi dan meningkatkan kualitas hidup pasien. Penelitian ini menggunakan dataset dari Kaggle yang terdiri dari 768 data dengan 9 atribut, termasuk kadar glukosa dan BMI. Algoritma K-Nearest Neighbor (KNN) dipilih karena kesederhanaan dan efektivitasnya dalam prediksi. Proses penelitian dilakukan menggunakan RapidMiner untuk preprocessing, pemodelan, dan evaluasi, dengan pembagian dataset sebesar 80% untuk pelatihan dan 20% untuk pengujian. Hasil evaluasi menunjukkan akurasi model mencapai 80,73%, dengan precision 74,79% dan recall 67,54% untuk kelas positif. Meskipun akurasi yang tinggi, rendahnya nilai recall menunjukkan bahwa beberapa kasus diabetes tidak terdeteksi, sehingga memerlukan optimasi lebih lanjut. Penelitian ini menyoroti potensi KNN dalam deteksi dini diabetes sebagai alat bantu keputusan bagi tenaga medis. Rekomendasi untuk meningkatkan performa model termasuk penggunaan dataset yang lebih besar dan penerapan teknik pembelajaran mesin yang lebih canggih. Diharapkan hasil penelitian ini dapat berkontribusi pada pengembangan teknologi prediktif di bidang kesehatan.
References
American Diabetes Association. (2020). Classification and Diagnosis of Diabetes: Standars of Medical Care in Diabetes. Diabetes Care, 43(Suppl 1), S14-S31.
Asmarani, A. e. (2022). Implementasi Algoritma K-Nearest Neighbor Untuk Memprediksi Penyakit Diabetes. JAKAKOM, Volume 2, Nomor 2.
Cover, T. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13(1), 21-27. .
Delen D. Walker G. & Kadam A. (2013). Predicting breast cancer survivability: A comparison of three data mining methods. Artificial Intellegence in Medicine, 59(3), 169-184.
Han J. Kamber M. & Pei J. (2011). Data Mining: Concepts and Techniques. Morgan Kaufmann.
International Diabetes Federation. (2021). “IDF Diabetes Atlas.”. Retrieved from [https://www.diabetesatlas.org].
Kaggle. (2023). Diabetes Prediction Dataset. etrieved from https://www.kaggle.com/datasets/iammustafatz/diabetes-prediction-dataset. .
Kargupta H. & Joshi A. (2000). Data Mining in health care . Journal of Healthcare: Promise and potential. Information Management, 14(2), 44-54.
Kaufman, L. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.
Keller J. M. Givens J. R. & Gray M. L. (1985). A Fuzzy K-nearest neighbor algorithm. IEEE Transactions on Systems, Man, and Cybernetics, 15(4), 580-585.
Raghupathi W. & Raghupathi V. (2014). Big data analytics in healthcare: Promise and potential. Helath Information Science and System, 2(1), 3.
Sharma S. & Gupta S. (2016). Data Mining techniques for health care. International Journal of Computer Applications, 139(8), 1-5.
WHO. (2021). Global Diabetes Observatory. World Health Organization. Retrieved from https://www.who.int/diabetes.
Zhang, Y. (2016). K-Nearest Neighbor (KNN) Algorithm for Classification. International Journal of Computer Applications, 140(5), 25-29. .