Prediksi Kelulusan Mahasiswa Menggunakan Algoritma Decision Tree dengan Metode CART

Authors

  • Asri Sukma Universitas Pamulang
  • Anggoro Riski Universitas Pamulang
  • Muhamad Reza Nur Ihsan Universitas Pamulang
  • Perani Rosyani Universitas Pamulang

Keywords:

Mesin Pembelajaran, Pohon Keputusan, Kelulusan Mahasiswa, Klasifikasi, CART

Abstract

Kelulusan tepat waktu merupakan indikator penting kinerja perguruan tinggi dan keberhasilan proses akademik mahasiswa. Tingkat keterlambatan kelulusan yang masih tinggi menunjukkan perlunya pendekatan prediktif berbasis data untuk mengidentifikasi mahasiswa berisiko sejak dini. Penelitian ini bertujuan membangun model prediksi kelulusan mahasiswa menggunakan algoritma Decision Tree dengan pendekatan CART. Dataset yang digunakan berasal dari Kaggle dan terdiri dari 379 data mahasiswa dengan variabel akademik dan non-akademik. Tahapan penelitian meliputi preprocessing data, pemodelan, evaluasi kinerja, serta analisis feature importance dan reduksi fitur. Evaluasi dilakukan menggunakan confusion matrix, akurasi, precision, recall, F1-score, serta cross-validation. Hasil penelitian menunjukkan bahwa variabel status mahasiswa dan beberapa nilai IPS memiliki pengaruh paling signifikan terhadap prediksi kelulusan. Setelah dilakukan tuning hiperparameter dan stratified cross-validation, model mencapai akurasi hingga 92,1% dan menunjukkan stabilitas yang lebih baik. Model dengan fitur terpilih dinilai lebih efisien dan interpretatif sehingga berpotensi diimplementasikan sebagai sistem peringatan dini bagi institusi pendidikan.

References

Arifin, M., & Adiyono, S. (2024). Hyperparameter tuning in machine learning to predict student academic achievement. International Journal of Artificial Intelligence Research, 8(1), 1–8. https://ijair.id/index.php/ijair/article/view/1214

Balcan, M. F., & Sharma, D. (2024). Learning accurate and interpretable decision trees. Proceedings of Machine Learning Research, 244, 288–307.

Bangsa, P. D., & Hermawan, I. (2021). “Jurnal Teknologi Terpadu,” J. Teknol. Terpadu, vol. 7, no. 1, pp. 15–22, 2021, [Online]. Available: https://media.neliti.com/media/publications/493730-water-ph-and-turbidity-control-system-in-0a553e14.pdf

Candra, A. P. (2025). Analisis data menggunakan Python: Memperkenalkan Pandas dan NumPy. Journal of Information System Education Development, 3(1), 11–16. https://doi.org/10.62386/jised.v3i1.118

Darujati, C., et al. (2012). “Pemanfaatan teknik supervised untuk klasifikasi teks bahasa Indonesia” Text, vol. 16, no. 1, pp. 1–8, 2012.

Fahrudin, N. F., Putra, K. R., Umaroh, S., & Lautan, G. B. (2024). Influence of data scaling and train/test split ratios on LightGBM efficacy for obesity rate prediction. MIND Journal, 9(2), 220–234. https://doi.org/10.26760/mindjournal.v9i2.220-234

Faisal, F., Dhika, H., & Veris, H. (2021). Penerapan algoritma decision tree dalam penjualan handphone. JRKT (Jurnal Rekayasa Komputasi Terapan), 1(4). https://doi.org/10.30998/jrkt.v1i04.6157

Fatimah, & Nuryaningsih. (2018). Buku ajar asuhan kebidanan pada kehamilan. Yogyakarta: KMedia.

Hakim, A. S., & Rilvani, E. (2025). Prediksi cuaca menggunakan metode classification ID3 dan CART. Jurnal Media Akademik, 3(8). https://doi.org/10.62281/v3i8.2669

Ikasari, I. H., Rosyani, P., & Amalia, R. (2025). Klasifikasi jenis buah menggunakan metode CNN. RIGGS: Journal of Artificial Intelligence and Digital Business, 4(2), 5451–5458. https://doi.org/10.31004/riggs.v4i2.1271

Khasanah, N., Saputri, D. U. E., Hidayat, T., & Aziz, F. (2025). Prediksi kelulusan mahasiswa menggunakan algoritma C4.5 dengan RapidMiner: Studi kasus data akademik perguruan tinggi XYZ. Indonesian Journal of Computer Science, 4(2), 100–107. https://doi.org/10.31294/ijcs.v4i2.9647

Kusuma, S. D. Y., Al Islami, H., & Rosyani, P. (2025). Penerapan Naive Bayes untuk klasifikasi penyakit endokrin pada pasien lansia. KERNEL: Jurnal Riset Inovasi Bidang Informatika dan Pendidikan Informatika, 5(2), 72–82. https://doi.org/10.31284/j.kernel.2024.v5i2.7312

Mienye, I. D., & Jere, N. (2024). A survey of decision trees: Concepts, algorithms, and applications. IEEE Access, 12, 86716–86727. https://doi.org/10.1109/ACCESS.2024.3416838

Pamuji, F. Y., Muslikh, A. R., Arief, R. M., & Muti, D. (2024). Komparasi metode mean dan KNN imputation dalam mengatasi missing value pada dataset kecil. Jurnal Informatika Polinema, 10(2), 257–264.

Qiu, J. (2024). An analysis of model evaluation with cross-validation: Techniques, applications, and recent advances. Advances in Economics, Management and Political Sciences, 99(1), 69–72. https://doi.org/10.54254/2754-1169/99/2024ox0213

Rafika, C. S., Reynanda, R. M., & Sari, A. P. (2025). Penerapan decision tree CART untuk klasifikasi risiko gagal studi mahasiswa. Jurnal Mahasiswa Teknik Informatika, 4(2), 37–46. https://doi.org/10.35473/jamastika.v4i2.4145

Rahayu, E. S., Anugrah, O., Purnama, A., Zakaria, H., & Rosyani, P. (2025). Klasifikasi penyakit jamur pada tanaman tomat dengan algoritma SVM. Bulletin of Computer Science Research, 5(4), 756–762. https://doi.org/10.47065/bulletincsr.v5i4.515

Rahayu, S., Rosyani, P., Saputra, R. Y., Umar, R. A., Prasdio, S., & Syach, W. A. (2025). Application of expert system in rice seedling selection based on smart data with methods: Knowledge-based system and decision tree. International Journal of Integrated Science, 4(1), 217–224. https://doi.org/10.55927/ijis.v4i1.13510

Rahman, A. (2022). Peran prestasi non-akademik dalam membangun karakter dan keterampilan sosial siswa. Jurnal Pendidikan dan Konseling, 4(1980), 1349–1358.

Rajbahadur, G. K., Wang, S., Oliva, G. A., Kamei, Y., & Hassan, A. E. (2022). The impact of feature importance methods on the interpretation of defect classifiers. IEEE Transactions on Software Engineering, 48(7), 2245–2261. https://doi.org/10.1109/TSE.2021.3056941

Renyut, D. H., Wabula, Y., & Ferdinand, F. (2022). Prediksi kelulusan mahasiswa menggunakan algoritma C4.5 (Studi kasus: Sekolah Tinggi Ilmu Administrasi Trinitas Ambon). Simtek: Jurnal Sistem Informasi dan Teknik Komputer, 7(2), 80–86. https://doi.org/10.51876/simtek.v7i2.137

Sukamto, & Shalahuddin. (2014). Rekayasa perangkat lunak terstruktur dan berorientasi objek. Bandung: Informatika.

Wang, H., Liang, Q., Hancock, J. T., & Khoshgoftaar, T. M. (2024). Feature selection strategies: A comparative analysis of SHAP-value and importance-based methods. Journal of Big Data, 11(1). https://doi.org/10.1186/s40537-024-00905-w

Yazid, A. S. (2024). Eksplorasi data akademik untuk memprediksi ketepatan waktu lulus mahasiswa menggunakan algoritma Naive Bayes. Jurnal Teknik Informatika dan Sistem Informasi, 11(4), 558–568.

Yunita, D., Rosyani, P., & Amalia, R. (2018). Analisa prestasi siswa berdasarkan kedisiplinan, nilai hasil belajar, sosial ekonomi dan aktivitas organisasi menggunakan algoritma Naïve Bayes. Jurnal Informatika Universitas Pamulang, 3(4), 209. https://doi.org/10.32493/informatika.v3i4.2032

Zhu, W., Qiu, R., & Fu, Y. (2024). Comparative study on the performance of categorical variable encoders in classification and regression tasks. arXiv. https://arxiv.org/abs/2401.09682

Downloads

Published

2025-12-17

How to Cite

Sukma, A., Riski, A., Reza Nur Ihsan, M., & Rosyani, P. (2025). Prediksi Kelulusan Mahasiswa Menggunakan Algoritma Decision Tree dengan Metode CART. AI Dan SPK : Jurnal Artificial Intelligent Dan Sistem Penunjang Keputusan, 3(2), 110–122. Retrieved from https://jurnalmahasiswa.com/index.php/aidanspk/article/view/3277

Most read articles by the same author(s)

1 2 3 > >> 

Similar Articles

<< < 1 2 3 4 5 6 7 > >> 

You may also start an advanced similarity search for this article.