Deteksi Dini Website Phising Berbasis Karakteristik URL Menggunakan Algoritma Random Forest sebagai Upaya Penegakan Keamanan Siber

Authors

  • Muhammad Faqih Alharits Universitas Pamulang
  • Hanif Maulana Ar Rasyid Universitas Pamulang
  • Rifky Firmansyah Universitas Pamulang
  • Abdullah Rendra Zuriansyah Universitas Pamulang
  • Ardiansyah Maulana Universitas Pamulang
  • Firza Aditiya Ardiansah Universitas Pamulang
  • Rahmawati Universitas Pamulang

Keywords:

Phising, Random Forest, Keamanan Siber, Deteksi URL, Etika Profesi

Abstract

Phising merupakan salah satu ancaman keamanan siber yang paling merugikan, dengan modus menyamar sebagai website terpercaya untuk mencuri data sensitif pengguna. Penleitian ini mengembangkan sistem deteksi dini phising website berbasis karakteristik URL menggunakan algoritma Random Forest. Dataset yang digunakan terdiri dari 10.000 sampel URL (50% legitimate, 50% phising) dengan 48 fitur berbasis karakteristik URL. Model baseline Random Forest mencapai akurasi 98,55%, presisi 98,60%, recall 98,50%, F1-score 98,55%, dan AUC-ROC 99,09%. Hyperparameter tuning menggunakan RandomizedSearchCV menghasilkan model dengan performa serupa namun sedikit lebih rendah pada recall (98,20%). Analisis feature importance menunjukkan bahwa PctExtHyperlinks (20,69%), PctExtNullSelfRedirectHyperlinksRT (16,77%), dan FrequentDomainNameMismatch (7,78%) merupakan fitur paling informatif. Kajian etika profesi dilakukan terhadap implikasi false positive dan false negative, tanggung jawab profesional pengembang, serta kepatuhan terhadap regulasi Indonesia (UU ITE, UU PDP No. 27 Tahun 2022). Penelitian ini menunjukkan bahwa pendekatan machine learning berbasis Random Forest efektif untuk deteksi phishing dan dapat berkontribusi pada penegakan keamanan siber di Indonesia.

References

Breiman, L. (2001). Random Forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324

Jain, A. K., & Gupta, B. B. (2019). A machine learning based approach for phishing detection using hyperlinks information. Journal of Ambient Intelligence and Humanized Computing, 10(5), 2015–2028. https://doi.org/10.1007/s12652-018-0798-z

Karim, A., Shahroz, M., Mustofa, K., Belhaouari, S. B., & Joga, S. R. K. (2023). Phishing Detection System Through Hybrid Machine Learning Based on URL. IEEE Access, 11, 36805–36822. https://doi.org/10.1109/ACCESS.2023.3252366

Rao, R. S., & Pais, A. R. (2018). Detection of phishing websites using an efficient feature-based machine learning framework. Neural Computing and Applications. https://doi.org/10.1007/s00521-017-3305-0

Sahingoz, O. K., Buber, E., Demir, O., & Diri, B. (2019). Machine learning based phishing detection from URLs. Expert Systems with Applications, 117, 345–357. https://doi.org/10.1016/j.eswa.2018.09.029

Shashwat. (2020). Phishing Dataset for Machine Learning. https://www.kaggle.com/datasets/shashwatwork/phishing-dataset-for-machine-learning

Sumartono, E., Harliyanto, R., Situmeang, S. M. T., Siagian, D. S., & Septaria, E. (2024). The Legal Implications of Data Privacy Laws, Cybersecurity Regulations, and AI Ethics in a Digital Society. The Journal of Academic Science, 1(2), 103–110. https://doi.org/10.59613/29qypw51

Yang, R., Zheng, K., Wu, B., Wu, C., & Wang, X. (2021). Phishing Website Detection Based on Deep Convolutional Neural Network and Random Forest Ensemble Learning. Sensors, 21(24), 8281. https://doi.org/10.3390/s21248281

Downloads

Published

2026-06-24

How to Cite

Alharits, M. F., Ar Rasyid, H. M., Firmansyah, R., Zuriansyah, A. R., Maulana, A., Ardiansah, F. A., & Rahmawati. (2026). Deteksi Dini Website Phising Berbasis Karakteristik URL Menggunakan Algoritma Random Forest sebagai Upaya Penegakan Keamanan Siber . JRIIN :Jurnal Riset Informatika Dan Inovasi, 4(4), 1020–1029. Retrieved from https://jurnalmahasiswa.com/index.php/jriin/article/view/4175