Klastering Penyakit Diabetes dengan Metode K-Means
Keywords:
Diabetes, Klastering, K-Means, Analisis Data, VisualisasiAbstract
Penelitian ini bertujuan untuk mengklasifikasikan penyakit diabetes menggunakan metode K-Means berdasarkan karakteristik klinis dan demografis pasien. Data yang digunakan diambil dari platform Kaggle, terdiri dari 768 entri dengan delapan fitur numerik yang relevan. Proses analisis melibatkan normalisasi data dengan StandardScaler dan penentuan jumlah klaster optimal menggunakan metode Elbow. Hasil penelitian menunjukkan bahwa tiga klaster optimal dapat diidentifikasi, masing-masing mencerminkan karakteristik unik yang berkaitan dengan profil risiko diabetes. Klaster pertama menunjukkan pasien dengan kadar glukosa tinggi dan BMI tinggi, yang berkaitan dengan diabetes tipe 2. Klaster kedua mencerminkan pasien dengan BMI rendah dan kadar glukosa normal, sedangkan klaster ketiga mengelompokkan pasien dengan kadar insulin rendah dan usia muda. Temuan ini menggarisbawahi potensi algoritma K-Means untuk mendukung pengambilan keputusan medis yang lebih personal dan terarah.
References
Angkasa, V., & Pangaribuan, J. J. (2022). Information System Development Komparasi Tingkat Akurasi Random Forest Dan KNN Untuk Mendiagnosis Penyakit Kanker Payudara. Journal of Information System Development, 7(1), 37–38. Retrieved from http://dx.doi.org/10.19166/xxxx
Chen, W., Chen, S., Zhang, H., & Wu, T. (2017). A hybrid prediction model for type 2 diabetes using K-Means and decision tree. In 2017 8th IEEE International Conference on Software Engineering and Service Science (ICSESS) (pp. 386–390). https://doi.org/10.1109/ICSESS.2017.8342938
Dewi, N. L. P. P., Purnama, I. N., & Utami, N. W. (2022). Penerapan Data Mining Untuk Clustering Penilaian Kinerja Dosen Menggunakan Algoritma K-Means (Studi Kasus: STMIK Primakara). Jurnal Ilmiah Teknologi Informasi Asia, 16(2), 105. https://doi.org/10.32815/jitika.v16i2.761
Fuadah, A. W., Arifin, F. N., & Juwita, O. (2021). Optimasi K-Klasterisasi Ketahanan Pangan Kabupaten Jember Menggunakan Metode Elbow. INFORMAL Informatics Journal, 6(3), 136. https://doi.org/10.19184/isj.v6i3.28363
Herlinda, V., & Darwis, D. (2021). Analisis Clustering Untuk Recredesialing Fasilitas Kesehatan Menggunakan Metode Fuzzy C-Means. Darwis, Dartono, 2(2), 94–99. Retrieved from http://jim.teknokrat.ac.id/index.php/JTSI
Prasetyo, V. R., Mercifia, M., Averina, A., Sunyoto, L., & Budiarjo, B. (2022). Prediksi Rating Film Pada Website IMDb Menggunakan Metode Neural Network. Network Engineering Research Operation, 7(1), 1. https://doi.org/10.21107/nero.v7i1.268
Rakhmad, K. (2021). Rekonstruksi Tiga Dimensi Area Pegunungan Berdasarkan Citra Satelit Dua Dimensi Secara Otomatis. Tugas Akhir - Universitas Islam Indonesia. Retrieved from https://dspace.uii.ac.id/handle/123456789/34042%25
Yadav, S., Singh, M. K., & Kumar, P. (2023). Data Mining Applications for Enhancing Healthcare Services: A Comprehensive Review. International Journal of Engineering Technology and Management Sciences, 7(5), 325–333. https://doi.org/10.46647/ijetms.2023.v07i05.038
Yan, S., Kwan, Y. H., Tan, C. S., Thumboo, J., & Low, L. L. (2018). A systematic review of the clinical application of data-driven population segmentation analysis. BMC Medical Research Methodology, 18(1), 1–12. https://doi.org/10.1186/s12874-018-0584-9
Yang, W. C., Lai, J. P., Liu, Y. H., Lin, Y. L., Hou, H. P., & Pai, P. F. (2024). Using Medical Data and Clustering Techniques for a Smart Healthcare System. Electronics, 13(1), 1–20. https://doi.org/10.3390/electronics13010140