Implementasi Model Machine Learning Untuk Klasifikasi Dan Prediksi Pada Dataset Bunga Iris
Keywords:
Machine Learning; Classification; Linear Regression; Random Forest; PredictionAbstract
− Penelitian ini bertujuan untuk mengimplementasikan berbagai model machine learning dalam menganalisis dataset Iris, termasuk Logistic Regression, Random Forest, dan Linear Regression. Dataset Iris digunakan karena sifatnya yang sederhana namun mencakup masalah klasifikasi dan regresi. Proses melibatkan preprocessing data, seperti scaling fitur, serta pembagian dataset menjadi data latih dan data uji. Evaluasi dilakukan menggunakan metrik akurasi, confusion matrix, mean squared error (MSE), dan R-squared (R²). Hasil penelitian menunjukkan bahwa semua model mencapai performa sempurna pada tugas klasifikasi, dengan akurasi 100% dan confusion matrix yang hanya menunjukkan prediksi benar. Model Linear Regression juga menunjukkan kinerja yang sangat baik dengan nilai R² = 1.00, mengindikasikan kemampuan untuk menjelaskan seluruh variasi data. Korelasi antar variabel mengungkapkan bahwa fitur petal memiliki pengaruh lebih signifikan dibandingkan fitur sepal dalam membedakan spesies. Visualisasi hasil prediksi menunjukkan pola distribusi nilai aktual dan prediksi yang hampir identik.
References
Arifin, O., & Rofianto, D. (2023). Perbandingan metode klasifikasi SOM dan LVQ pada data bunga iris dengan parameter dimodifikasi. Decode: Jurnal Pendidikan Teknologi Informasi, 3(1), 130–138. https://doi.org/10.51454/decode.v3i1.135
Fadlil, A., Herman, & Dikky Praseptian, M. (2023). Single imputation using statistics-based and K Nearest Neighbor methods for numerical datasets. Ingenierie des Systemes d’Information, 28(2), 451–459. https://doi.org/10.18280/isi.280221
Fahmi, M. N. (2023). Implementasi machine learning menggunakan Python library: Scikit-learn (supervised dan unsupervised learning). Sains Data Jurnal Studi Matematika dan Teknologi, 1(2), 87–96. https://doi.org/10.52620/sainsdata.v1i2.31
Joshi, R. D., & Dhakal, C. K. (2021). Predicting type 2 diabetes using logistic regression and machine learning approaches. International Journal of Environmental Research and Public Health, 18(14). https://doi.org/10.3390/ijerph18147346
Rahman, B., Fauzi, F., & Amri, S. (2023). Perbandingan Hasil Klasifikasi Data Iris menggunakan Algoritma K-Nearest Neighbor dan Random Forest. Journal Of Data Insights, 1(1), 19–26. https://doi.org/10.26714/jodi.v1i1.135
Schonlau, M., & Zou, R. Y. (2020). The random forest algorithm for statistical learning. Stata Journal, 20(1), 3–29. https://doi.org/10.1177/1536867X20909688
Setia Budi, E., Nofriyaldi Chan, A., Priscillia Alda, P., & Arif Fauzi Idris, M. (2024). Optimasi model machine learning untuk klasifikasi dan prediksi citra menggunakan algoritma convolutional neural network. Media Online, 4(5), 502–509. https://doi.org/10.30865/resolusi.v4i5.1892
Simanjuntak, W. O., Bijaksana, A., Negara, P., & Septriana, R. (2023). Perbandingan algoritma logistic regression dan random forest (Studi kasus: Klasifikasi emosi tweet). Jurnal Aplikasi dan Riset Informatika, 2, 160–164. https://doi.org/10.26418/juara.v2i1.69682
Susetyoko, R., Yuwono, W., Purwantini, E., & Ramadijanti, N. (2022). Perbandingan metode random forest, regresi logistik, naïve bayes, dan multilayer perceptron pada klasifikasi uang kuliah tunggal (UKT). Jurnal Infomedia: Teknik Informatika, Multimedia & Jaringan, 7(1), 8–16.