Implementasi Algoritma Naive Bayes dalam Identifikasi Berita Hoaks pada Portal Berita Online Indonesia
Keywords:
Berita Hoaks, Kompas Indonesia, Naive Bayes, TF-IDF, Klasifikasi TeksAbstract
Penyebaran disinformasi dan berita hoaks di media digital merupakan tantangan besar bagi integritas informasi dan stabilitas sosial. Penelitian ini bertujuan untuk mengimplementasikan algoritma Machine Learning berbasis Multinomial Naive Bayes dalam mengidentifikasi berita hoaks secara otomatis dengan memanfaatkan komparasi karakteristik teks dari portal berita resmi Kompas Indonesia dan pangkalan data TurnBackHoax (MAFINDO). Dataset yang digunakan dalam penelitian ini berjumlah 2.000 artikel berita, yang terdiri atas 1.000 artikel berita valid dari Kompas Indonesia (representasi fakta) dan 1.000 artikel dari TurnBackHoax (representasi hoaks). Proses ekstraksi fitur dilakukan menggunakan metode Term Frequency - Inverse Document Frequency (TF-IDF). Berdasarkan pembagian data uji sebesar 20% (400 artikel), algoritma Naive Bayes sukses membukukan akurasi performa yang tinggi sebesar 94%. Hasil analisis leksikal membuktikan adanya perbedaan pola bahasa yang tajam, di mana berita resmi Kompas didominasi oleh kosakata informatif struktural, sedangkan teks hoaks didominasi oleh entitas media sosial dan klaim visual manipulatif. Penelitian ini menyimpulkan bahwa klasifikasi berbasis Naive Bayes sangat efisien dan adaptif untuk diintegrasikan sebagai sistem penyaringan hoaks otomatis skala besar di Indonesia.
References
Abdillah., Diah, R., & Nia, K. (2025). SISTEM DETEKSI HOAKS PADA BERITA ONLINE MENGGUNAKAN METODE. 2, 449–465.
Diki, M., & Nurina, B. (2022). Penerapan Algoritma K-Nearest Neighbor dalam Klasifikasi Judul Berita Hoax.
Ferguson., B. B., & Istiono, W. (2024). Hoax News Detection in Indonesian Political Headlines Using Multinomial Naive Bayes Bertrand. 5(4), 168–179. https://doi.org/10.62527/jitsi.5.
Kirana, A. S., Roeswidiah, R., & Pudoli, A. (2025). Analisis Sentimen Pada Media Sosial Terhadap Layanan Samsat Digital Nasional. 8, 53–63.
Munna, A., & Zuliarso, E. (2024). Interpretation of Stacking Ensemble model for sentiment analysis of online loan application reviews using LIME. Aiti, 21(2), 183–196.
Prayoga, A. Y., Hadiana, A. I., & Umbara, F. R. (2021). DETEKSI HOAX PADA BERITA ONLINE BAHASA INGGRIS MENGGUNAKAN BERNOULLI NAÏVE BAYES DENGAN EKSTRAKSI FITUR TF-IDF Agri. 2(10).
Salsabila, B., Huda, N., Ayni, F. N., Angelina, D. A., Informatika, T., Teknik, F., Nusantara, U., & Kediri, P. (2026). Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression. 5.
Tobing, C. J. L., Wijayakusuma, I. G. N. L., Putu, L., Harini, I., & Udayana, U. (2025). Detection of Political Hoax News Using Fine-Tuning IndoBERT. 9(2), 354–360.




