Prediksi Kelulusan Mahasiswa Menggunakan Algoritma Decision Tree dengan Metode CART
Keywords:
Mesin Pembelajaran, Pohon Keputusan, Kelulusan Mahasiswa, Klasifikasi, CARTAbstract
Kelulusan tepat waktu merupakan indikator penting kinerja perguruan tinggi dan keberhasilan proses akademik mahasiswa. Tingkat keterlambatan kelulusan yang masih tinggi menunjukkan perlunya pendekatan prediktif berbasis data untuk mengidentifikasi mahasiswa berisiko sejak dini. Penelitian ini bertujuan membangun model prediksi kelulusan mahasiswa menggunakan algoritma Decision Tree dengan pendekatan CART. Dataset yang digunakan berasal dari Kaggle dan terdiri dari 379 data mahasiswa dengan variabel akademik dan non-akademik. Tahapan penelitian meliputi preprocessing data, pemodelan, evaluasi kinerja, serta analisis feature importance dan reduksi fitur. Evaluasi dilakukan menggunakan confusion matrix, akurasi, precision, recall, F1-score, serta cross-validation. Hasil penelitian menunjukkan bahwa variabel status mahasiswa dan beberapa nilai IPS memiliki pengaruh paling signifikan terhadap prediksi kelulusan. Setelah dilakukan tuning hiperparameter dan stratified cross-validation, model mencapai akurasi hingga 92,1% dan menunjukkan stabilitas yang lebih baik. Model dengan fitur terpilih dinilai lebih efisien dan interpretatif sehingga berpotensi diimplementasikan sebagai sistem peringatan dini bagi institusi pendidikan.
References
Arifin, M., & Adiyono, S. (2024). Hyperparameter tuning in machine learning to predict student academic achievement. International Journal of Artificial Intelligence Research, 8(1), 1–8. https://ijair.id/index.php/ijair/article/view/1214
Balcan, M. F., & Sharma, D. (2024). Learning accurate and interpretable decision trees. Proceedings of Machine Learning Research, 244, 288–307.
Bangsa, P. D., & Hermawan, I. (2021). “Jurnal Teknologi Terpadu,” J. Teknol. Terpadu, vol. 7, no. 1, pp. 15–22, 2021, [Online]. Available: https://media.neliti.com/media/publications/493730-water-ph-and-turbidity-control-system-in-0a553e14.pdf
Candra, A. P. (2025). Analisis data menggunakan Python: Memperkenalkan Pandas dan NumPy. Journal of Information System Education Development, 3(1), 11–16. https://doi.org/10.62386/jised.v3i1.118
Darujati, C., et al. (2012). “Pemanfaatan teknik supervised untuk klasifikasi teks bahasa Indonesia” Text, vol. 16, no. 1, pp. 1–8, 2012.
Fahrudin, N. F., Putra, K. R., Umaroh, S., & Lautan, G. B. (2024). Influence of data scaling and train/test split ratios on LightGBM efficacy for obesity rate prediction. MIND Journal, 9(2), 220–234. https://doi.org/10.26760/mindjournal.v9i2.220-234
Faisal, F., Dhika, H., & Veris, H. (2021). Penerapan algoritma decision tree dalam penjualan handphone. JRKT (Jurnal Rekayasa Komputasi Terapan), 1(4). https://doi.org/10.30998/jrkt.v1i04.6157
Fatimah, & Nuryaningsih. (2018). Buku ajar asuhan kebidanan pada kehamilan. Yogyakarta: KMedia.
Hakim, A. S., & Rilvani, E. (2025). Prediksi cuaca menggunakan metode classification ID3 dan CART. Jurnal Media Akademik, 3(8). https://doi.org/10.62281/v3i8.2669
Ikasari, I. H., Rosyani, P., & Amalia, R. (2025). Klasifikasi jenis buah menggunakan metode CNN. RIGGS: Journal of Artificial Intelligence and Digital Business, 4(2), 5451–5458. https://doi.org/10.31004/riggs.v4i2.1271
Khasanah, N., Saputri, D. U. E., Hidayat, T., & Aziz, F. (2025). Prediksi kelulusan mahasiswa menggunakan algoritma C4.5 dengan RapidMiner: Studi kasus data akademik perguruan tinggi XYZ. Indonesian Journal of Computer Science, 4(2), 100–107. https://doi.org/10.31294/ijcs.v4i2.9647
Kusuma, S. D. Y., Al Islami, H., & Rosyani, P. (2025). Penerapan Naive Bayes untuk klasifikasi penyakit endokrin pada pasien lansia. KERNEL: Jurnal Riset Inovasi Bidang Informatika dan Pendidikan Informatika, 5(2), 72–82. https://doi.org/10.31284/j.kernel.2024.v5i2.7312
Mienye, I. D., & Jere, N. (2024). A survey of decision trees: Concepts, algorithms, and applications. IEEE Access, 12, 86716–86727. https://doi.org/10.1109/ACCESS.2024.3416838
Pamuji, F. Y., Muslikh, A. R., Arief, R. M., & Muti, D. (2024). Komparasi metode mean dan KNN imputation dalam mengatasi missing value pada dataset kecil. Jurnal Informatika Polinema, 10(2), 257–264.
Qiu, J. (2024). An analysis of model evaluation with cross-validation: Techniques, applications, and recent advances. Advances in Economics, Management and Political Sciences, 99(1), 69–72. https://doi.org/10.54254/2754-1169/99/2024ox0213
Rafika, C. S., Reynanda, R. M., & Sari, A. P. (2025). Penerapan decision tree CART untuk klasifikasi risiko gagal studi mahasiswa. Jurnal Mahasiswa Teknik Informatika, 4(2), 37–46. https://doi.org/10.35473/jamastika.v4i2.4145
Rahayu, E. S., Anugrah, O., Purnama, A., Zakaria, H., & Rosyani, P. (2025). Klasifikasi penyakit jamur pada tanaman tomat dengan algoritma SVM. Bulletin of Computer Science Research, 5(4), 756–762. https://doi.org/10.47065/bulletincsr.v5i4.515
Rahayu, S., Rosyani, P., Saputra, R. Y., Umar, R. A., Prasdio, S., & Syach, W. A. (2025). Application of expert system in rice seedling selection based on smart data with methods: Knowledge-based system and decision tree. International Journal of Integrated Science, 4(1), 217–224. https://doi.org/10.55927/ijis.v4i1.13510
Rahman, A. (2022). Peran prestasi non-akademik dalam membangun karakter dan keterampilan sosial siswa. Jurnal Pendidikan dan Konseling, 4(1980), 1349–1358.
Rajbahadur, G. K., Wang, S., Oliva, G. A., Kamei, Y., & Hassan, A. E. (2022). The impact of feature importance methods on the interpretation of defect classifiers. IEEE Transactions on Software Engineering, 48(7), 2245–2261. https://doi.org/10.1109/TSE.2021.3056941
Renyut, D. H., Wabula, Y., & Ferdinand, F. (2022). Prediksi kelulusan mahasiswa menggunakan algoritma C4.5 (Studi kasus: Sekolah Tinggi Ilmu Administrasi Trinitas Ambon). Simtek: Jurnal Sistem Informasi dan Teknik Komputer, 7(2), 80–86. https://doi.org/10.51876/simtek.v7i2.137
Sukamto, & Shalahuddin. (2014). Rekayasa perangkat lunak terstruktur dan berorientasi objek. Bandung: Informatika.
Wang, H., Liang, Q., Hancock, J. T., & Khoshgoftaar, T. M. (2024). Feature selection strategies: A comparative analysis of SHAP-value and importance-based methods. Journal of Big Data, 11(1). https://doi.org/10.1186/s40537-024-00905-w
Yazid, A. S. (2024). Eksplorasi data akademik untuk memprediksi ketepatan waktu lulus mahasiswa menggunakan algoritma Naive Bayes. Jurnal Teknik Informatika dan Sistem Informasi, 11(4), 558–568.
Yunita, D., Rosyani, P., & Amalia, R. (2018). Analisa prestasi siswa berdasarkan kedisiplinan, nilai hasil belajar, sosial ekonomi dan aktivitas organisasi menggunakan algoritma Naïve Bayes. Jurnal Informatika Universitas Pamulang, 3(4), 209. https://doi.org/10.32493/informatika.v3i4.2032
Zhu, W., Qiu, R., & Fu, Y. (2024). Comparative study on the performance of categorical variable encoders in classification and regression tasks. arXiv. https://arxiv.org/abs/2401.09682




