Prediksi Penyakit Diabetes Menggunakan Algoritma Naive Bayes Berbasis Data Mining dengan Software Orange

Authors

  • Fitri Yanti Universitas Pamulang
  • Abdul Majid Universitas Pamulang
  • Abelli Fikri Universitas Pamulang
  • Alvis Juliandry Universitas Pamulang
  • Ardiansyah Universitas Pamulang
  • Fikri Ariansyah Universitas Pamulang

Keywords:

Data mining, diabetes, naive bayes, orange, prediksi

Abstract

Diabetes mellitus adalah penyakit kronis dengan prevalensi yang terus meningkat secara global dan memerlukan deteksi dini untuk mencegah komplikasi serius. Penelitian ini bertujuan mengembangkan model prediksi diabetes menggunakan algoritma Naive Bayes dengan pendekatan data mining. Dataset yang digunakan adalah Pima Indians Diabetes Database yang terdiri dari 768 instances dengan 8 fitur medis. Metode penelitian meliputi preprocessing data (penanganan missing values dan normalisasi) serta implementasi algoritma menggunakan software Orange Data Mining. Evaluasi model menggunakan 10-Fold Cross-Validation menghasilkan akurasi sebesar 76.3%, precision 71.2%, recall 68.5%, dan F1-score 69.8%. Nilai AUC (Area under Curve) mencapai 0.82, mengindikasikan kemampuan diskriminasi model yang sangat baik (excellent). Model ini berpotensi membantu tenaga medis dalam melakukan screening awal pasien berisiko diabetes.

References

Demsar, J., Curk, T., Erjavec, A., Gorup, C., Hocevar, T., Milutinovic, M., et al. (2013). Orange: Data mining toolbox in Python. The Journal of Machine Learning Research, 14, 2349–2353.

Han, J. W., Kamber, M., & Pei, J. (2012). Data mining concepts and techniques (3rd ed.). Morgan Kaufmann Publishers.

Kaggle. (2016). Pima Indians Diabetes Database. https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database

Kavakiotis, I., Tsave, O., Salifoglou, A., Maglaveras, N., Vlahavas, I., & Chouvarda, I. (2017). Machine learning and data mining methods in diabetes research. Computational and Structural Biotechnology Journal, 15, 104–116. https://doi.org/10.1016/j.csbj.2016.12.005

Orange Data Mining. (2024). Naive Bayes classifier documentation.

Rish, I. (2001). An empirical study of the Naive Bayes classifier. IJCAI 2001 Workshop on Empirical Methods in Artificial Intelligence, 41–46.

World Health Organization. (2023). Diabetes. https://www.who.int/news-room/fact-sheets/detail/diabetes

Downloads

Published

2025-12-12

How to Cite

Yanti, F., Majid, A., Fikri, A., Juliandry, A., Ardiansyah, & Ariansyah, F. (2025). Prediksi Penyakit Diabetes Menggunakan Algoritma Naive Bayes Berbasis Data Mining dengan Software Orange. JRIIN :Jurnal Riset Informatika Dan Inovasi, 3(8), 2194–2196. Retrieved from https://jurnalmahasiswa.com/index.php/jriin/article/view/3164

Most read articles by the same author(s)

Similar Articles

1 2 3 4 5 6 7 8 9 10 > >> 

You may also start an advanced similarity search for this article.