Deteksi Dini Website Phising Berbasis Karakteristik URL Menggunakan Algoritma Random Forest sebagai Upaya Penegakan Keamanan Siber
Keywords:
Phising, Random Forest, Keamanan Siber, Deteksi URL, Etika ProfesiAbstract
Phising merupakan salah satu ancaman keamanan siber yang paling merugikan, dengan modus menyamar sebagai website terpercaya untuk mencuri data sensitif pengguna. Penleitian ini mengembangkan sistem deteksi dini phising website berbasis karakteristik URL menggunakan algoritma Random Forest. Dataset yang digunakan terdiri dari 10.000 sampel URL (50% legitimate, 50% phising) dengan 48 fitur berbasis karakteristik URL. Model baseline Random Forest mencapai akurasi 98,55%, presisi 98,60%, recall 98,50%, F1-score 98,55%, dan AUC-ROC 99,09%. Hyperparameter tuning menggunakan RandomizedSearchCV menghasilkan model dengan performa serupa namun sedikit lebih rendah pada recall (98,20%). Analisis feature importance menunjukkan bahwa PctExtHyperlinks (20,69%), PctExtNullSelfRedirectHyperlinksRT (16,77%), dan FrequentDomainNameMismatch (7,78%) merupakan fitur paling informatif. Kajian etika profesi dilakukan terhadap implikasi false positive dan false negative, tanggung jawab profesional pengembang, serta kepatuhan terhadap regulasi Indonesia (UU ITE, UU PDP No. 27 Tahun 2022). Penelitian ini menunjukkan bahwa pendekatan machine learning berbasis Random Forest efektif untuk deteksi phishing dan dapat berkontribusi pada penegakan keamanan siber di Indonesia.
References
Breiman, L. (2001). Random Forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
Jain, A. K., & Gupta, B. B. (2019). A machine learning based approach for phishing detection using hyperlinks information. Journal of Ambient Intelligence and Humanized Computing, 10(5), 2015–2028. https://doi.org/10.1007/s12652-018-0798-z
Karim, A., Shahroz, M., Mustofa, K., Belhaouari, S. B., & Joga, S. R. K. (2023). Phishing Detection System Through Hybrid Machine Learning Based on URL. IEEE Access, 11, 36805–36822. https://doi.org/10.1109/ACCESS.2023.3252366
Rao, R. S., & Pais, A. R. (2018). Detection of phishing websites using an efficient feature-based machine learning framework. Neural Computing and Applications. https://doi.org/10.1007/s00521-017-3305-0
Sahingoz, O. K., Buber, E., Demir, O., & Diri, B. (2019). Machine learning based phishing detection from URLs. Expert Systems with Applications, 117, 345–357. https://doi.org/10.1016/j.eswa.2018.09.029
Shashwat. (2020). Phishing Dataset for Machine Learning. https://www.kaggle.com/datasets/shashwatwork/phishing-dataset-for-machine-learning
Sumartono, E., Harliyanto, R., Situmeang, S. M. T., Siagian, D. S., & Septaria, E. (2024). The Legal Implications of Data Privacy Laws, Cybersecurity Regulations, and AI Ethics in a Digital Society. The Journal of Academic Science, 1(2), 103–110. https://doi.org/10.59613/29qypw51
Yang, R., Zheng, K., Wu, B., Wu, C., & Wang, X. (2021). Phishing Website Detection Based on Deep Convolutional Neural Network and Random Forest Ensemble Learning. Sensors, 21(24), 8281. https://doi.org/10.3390/s21248281




