Deteksi Dini Website Phising Berbasis Karakteristik URL Menggunakan Algoritma Random Forest sebagai Upaya Penegakan Keamanan Siber

Muhammad Faqih Alharits; Hanif Maulana Ar Rasyid; Rifky Firmansyah; Abdullah Rendra Zuriansyah; Ardiansyah Maulana; Firza Aditiya Ardiansah; Rahmawati

Authors

Muhammad Faqih Alharits Universitas Pamulang
Hanif Maulana Ar Rasyid Universitas Pamulang
Rifky Firmansyah Universitas Pamulang
Abdullah Rendra Zuriansyah Universitas Pamulang
Ardiansyah Maulana Universitas Pamulang
Firza Aditiya Ardiansah Universitas Pamulang
Rahmawati Universitas Pamulang

Keywords:

Phising, Random Forest, Keamanan Siber, Deteksi URL, Etika Profesi

Abstract

Phising merupakan salah satu ancaman keamanan siber yang paling merugikan, dengan modus menyamar sebagai website terpercaya untuk mencuri data sensitif pengguna. Penleitian ini mengembangkan sistem deteksi dini phising website berbasis karakteristik URL menggunakan algoritma Random Forest. Dataset yang digunakan terdiri dari 10.000 sampel URL (50% legitimate, 50% phising) dengan 48 fitur berbasis karakteristik URL. Model baseline Random Forest mencapai akurasi 98,55%, presisi 98,60%, recall 98,50%, F1-score 98,55%, dan AUC-ROC 99,09%. Hyperparameter tuning menggunakan RandomizedSearchCV menghasilkan model dengan performa serupa namun sedikit lebih rendah pada recall (98,20%). Analisis feature importance menunjukkan bahwa PctExtHyperlinks (20,69%), PctExtNullSelfRedirectHyperlinksRT (16,77%), dan FrequentDomainNameMismatch (7,78%) merupakan fitur paling informatif. Kajian etika profesi dilakukan terhadap implikasi false positive dan false negative, tanggung jawab profesional pengembang, serta kepatuhan terhadap regulasi Indonesia (UU ITE, UU PDP No. 27 Tahun 2022). Penelitian ini menunjukkan bahwa pendekatan machine learning berbasis Random Forest efektif untuk deteksi phishing dan dapat berkontribusi pada penegakan keamanan siber di Indonesia.

References

Breiman, L. (2001). Random Forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324

Jain, A. K., & Gupta, B. B. (2019). A machine learning based approach for phishing detection using hyperlinks information. Journal of Ambient Intelligence and Humanized Computing, 10(5), 2015–2028. https://doi.org/10.1007/s12652-018-0798-z

Karim, A., Shahroz, M., Mustofa, K., Belhaouari, S. B., & Joga, S. R. K. (2023). Phishing Detection System Through Hybrid Machine Learning Based on URL. IEEE Access, 11, 36805–36822. https://doi.org/10.1109/ACCESS.2023.3252366

Rao, R. S., & Pais, A. R. (2018). Detection of phishing websites using an efficient feature-based machine learning framework. Neural Computing and Applications. https://doi.org/10.1007/s00521-017-3305-0

Sahingoz, O. K., Buber, E., Demir, O., & Diri, B. (2019). Machine learning based phishing detection from URLs. Expert Systems with Applications, 117, 345–357. https://doi.org/10.1016/j.eswa.2018.09.029

Shashwat. (2020). Phishing Dataset for Machine Learning. https://www.kaggle.com/datasets/shashwatwork/phishing-dataset-for-machine-learning

Sumartono, E., Harliyanto, R., Situmeang, S. M. T., Siagian, D. S., & Septaria, E. (2024). The Legal Implications of Data Privacy Laws, Cybersecurity Regulations, and AI Ethics in a Digital Society. The Journal of Academic Science, 1(2), 103–110. https://doi.org/10.59613/29qypw51

Yang, R., Zheng, K., Wu, B., Wu, C., & Wang, X. (2021). Phishing Website Detection Based on Deep Convolutional Neural Network and Random Forest Ensemble Learning. Sensors, 21(24), 8281. https://doi.org/10.3390/s21248281

Deteksi Dini Website Phising Berbasis Karakteristik URL Menggunakan Algoritma Random Forest sebagai Upaya Penegakan Keamanan Siber

Authors

Keywords:

Abstract

References

Downloads

Published

How to Cite

Issue

Section

Make a Submission

Kontak

Templete

Menu

INDEX

ISSN

Information

Current Issue

Browse

Developed By