Analisis Perbandingan Algoritma Naive Bayes dan Random Forest dalam Klasifikasi Prediksi Area Rawan Kebakaran di DKI Jakarta
Keywords:
klasifikasi, Naive Bayes, Random Forest, kerawanan kebakaran, Orange Data MiningAbstract
Kebakaran permukiman merupakan salah satu bencana yang paling sering terjadi di DKI Jakarta, dengan frekuensi yang cenderung meningkat seiring kepadatan penduduk dan keterbatasan ruang hunian. Penelitian ini bertujuan membandingkan kinerja dua algoritma klasifikasi, yaitu Naive Bayes dan Random Forest, dalam memprediksi tingkat kerawanan kebakaran pada level kelurahan di seluruh wilayah DKI Jakarta. Dataset yang digunakan terdiri atas 2.564 instans dengan tiga variabel prediktor, yakni jumlah penduduk, kepadatan penduduk, dan frekuensi sosialisasi pencegahan kebakaran; variabel terakhir jarang dilibatkan pada penelitian sejenis sehingga menjadi salah satu unsur kebaruan studi ini. Pemodelan dilakukan menggunakan perangkat lunak Orange Data Mining dengan skema validasi silang terstratifikasi sepuluh lipat. Hasil pengujian menunjukkan bahwa Naive Bayes memperoleh akurasi (CA) 0,696 dan AUC 0,603, sedangkan Random Forest memperoleh CA 0,671 dan AUC 0,595, sehingga daya pisah kedua model tergolong setara dan moderat. Akan tetapi, analisis per-kelas mengungkap keterbatasan yang penting: akibat ketidakseimbangan data yang cukup tajam, di mana kelas berisiko tinggi hanya mencakup 29,8% data, kedua model cenderung memihak kelas mayoritas. Naive Bayes hampir gagal mengenali kelas berisiko tinggi dengan recall hanya 0,048, sedangkan Random Forest jauh lebih baik meskipun tetap rendah, yakni 0,217, serta memiliki koefisien korelasi Matthews (MCC) lebih tinggi (0,100 berbanding 0,047). Dengan demikian, Random Forest lebih sesuai untuk kebutuhan mitigasi yang menekankan deteksi area berisiko, sementara akurasi total yang tinggi terbukti menyesatkan apabila berdiri sendiri. Analisis kepentingan fitur menempatkan jumlah penduduk dan frekuensi sosialisasi sebagai dua variabel paling berpengaruh, sehingga memperkuat peran intervensi edukasi dalam mitigasi. Temuan ini menegaskan perlunya penanganan ketidakseimbangan data dan penambahan fitur dalam pengembangan sistem peringatan dini kebakaran berbasis data di wilayah perkotaan.
References
Ambarwati, V., Kurniawan, W., & Sa’dan Wahid, M. (2025). Sosialisasi dan simulasi penanggulangan kebakaran di Desa Cerme Lor Kecamatan Cerme Kota Gresik. Bima Abdi: Jurnal Pengabdian Masyarakat, 5(1), 69–75. https://doi.org/10.53299/bajpm.v5i1.1306
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
Demšar, J., Curk, T., Erjavec, A., Gorup, Č., Hočevar, T., Milutinovič, M., Možina, M., Polajnar, M., Toplak, M., Starič, A., Štajdohar, M., Umek, L., Žagar, L., Žbontar, J., Žitnik, M., & Zupan, B. (2013). Orange: Data mining toolbox in Python. Journal of Machine Learning Research, 14, 2349–2353. http://jmlr.org/papers/v14/demsar13a.html
Diba, F., Arbiastutie, Y., & Mangurai, S. U. N. M. (2024). Sosialisasi pencegahan dan penanggulangan kebakaran hutan pada anak-anak di Desa. Prima Abdika: Jurnal Pengabdian Masyarakat, 4(1), 110–117. https://doi.org/10.37478/abdika.v4i1.3668
Hamami, F., & Dahlan, I. A. (2022). Klasifikasi cuaca Provinsi DKI Jakarta menggunakan algoritma Random Forest dengan teknik oversampling. Jurnal Teknoinfo, 16(1), 87–92. https://doi.org/10.33365/jti.v16i1.1533
Kholish, M., Herdianto, A., Setiawan, R. F., & Samsinar, R. (2024). Perbandingan algoritma Random Forest dan Naive Bayes dalam memprediksi penyakit diabetes. Prosiding Seminar Nasional HUBISINTEK, 5(1), 322–328.
Li, Y., Li, G., Wang, K., Wang, Z., & Chen, Y. (2024). Forest fire risk prediction based on stacking ensemble learning for Yunnan Province of China. Fire, 7(1), 13. https://doi.org/10.3390/fire7010013
Negara, B. S., Kurniawan, R., Nazri, M. Z. A., Abdullah, S. N. H. S., Saputra, R. W., & Ismanto, A. (2020). Riau forest fire prediction using supervised machine learning. Journal of Physics: Conference Series, 1566(1), 012002. https://doi.org/10.1088/1742-6596/1566/1/012002
Nurwulandari, F. S. (2016). Kajian mitigasi bencana kebakaran di permukiman padat: Studi kasus Kelurahan Taman Sari, Kota Bandung. Infomatek: Jurnal Informatika, Manajemen dan Teknologi, 18(1), 27–36. https://doi.org/10.23969/infomatek.v18i1.506
Safitri, D., Hilabi, S. S., & Nurapriani, F. (2023). Analisis penggunaan algoritma klasifikasi dalam prediksi kelulusan menggunakan Orange Data Mining. Rabit: Jurnal Teknologi dan Sistem Informasi Univrab, 8(1), 75–81. https://doi.org/10.36341/rabit.v8i1.3009
Saragih, R. A. I., & Lestari, F. (2023). Kerentanan kebakaran daerah perkotaan: Analisis risiko dan pemetaan di Jakarta Timur, Indonesia. Jurnal Kesehatan Tambusai, 4(2), 1974–1981. https://doi.org/10.31004/jkt.v4i2.15311
Sasoko, W. H., Pujiharto, E. W., Haris, R., Kania, A. Y., Kusrini, & Kusnawi. (2024). Prediksi banjir di DKI Jakarta dengan menggunakan algoritma K-Means dan Random Forest. J-COM: Jurnal Informatika dan Teknologi Komputer, 5(1), 43–49.
Triyanto, S., Sunyoto, A., & Arief, M. R. (2021). Analisa klasifikasi bencana banjir berdasarkan curah hujan menggunakan algoritma Naïve Bayes. JOISIE: Journal of Information Systems and Informatics Engineering, 5(2), 109–117. https://doi.org/10.35145/joisie.v5i2.1785
Yuan, Y., & Wylie, A. G. (2024). Comparing machine learning and time series approaches in predictive modeling of urban fire incidents: A case study of Austin, Texas. ISPRS International Journal of Geo-Information, 13(5), 149. https://doi.org/10.3390/ijgi13050149




