Perbandingan Lexicon dan BERT dalam Analisis Sentimen Opini Publik Mengenai Kepolisian di Media X
Keywords:
analisis sentimen, kepolisian, media sosial X, lexicon-based, BERT, visualisasi dataAbstract
Media sosial X menjadi salah satu platform utama bagi masyarakat dalam menyampaikan opini terhadap isu-isu publik, termasuk yang berkaitan dengan institusi kepolisian. Penelitian ini bertujuan untuk menganalisis sentimen opini publik terhadap kepolisian dengan membandingkan dua pendekatan analisis sentimen, yaitu metode lexicon-based dan model BERT, serta menyajikan hasil analisis melalui visualisasi data interaktif menggunakan Tableau. Data diperoleh melalui proses crawling tweet berbahasa Indonesia dengan kata kunci yang berkaitan dengan kepolisian. Pengambilan data dibatasi pada fitur top tweets, sehingga penelitian ini bersifat eksploratif dan tidak dimaksudkan untuk merepresentasikan keseluruhan percakapan publik di media sosial. Tahapan pra-pemrosesan teks dilakukan untuk mengurangi noise sebelum proses klasifikasi sentimen. Pendekatan lexicon-based mengklasifikasikan sentimen berdasarkan daftar kata positif dan negatif, sedangkan model BERT melakukan klasifikasi sentimen berbasis konteks ke dalam kategori positif, negatif, dan netral. Hasil penelitian menunjukkan adanya perbedaan distribusi sentimen antara kedua metode, di mana pendekatan lexicon-based menghasilkan proporsi sentimen negatif yang lebih tinggi dibandingkan model BERT. Perbedaan tersebut mengindikasikan keterbatasan pendekatan berbasis kata dalam memahami konteks, sarkasme, dan variasi bahasa informal yang umum digunakan di media sosial. Visualisasi data menunjukkan adanya fluktuasi sentimen dan pola keterlibatan pengguna secara temporal, namun hasil tersebut perlu diinterpretasikan secara hati-hati mengingat keterbatasan data. Penelitian ini diharapkan dapat memberikan gambaran awal mengenai dinamika sentimen publik terhadap kepolisian di media sosial X serta menjadi dasar bagi penelitian lanjutan dengan cakupan data yang lebih luas.
References
Ainin, S., Feizollah, A., Anuar, N. B., & Abdullah, N. A. (2020). Sentiment analyses of multilingual social media data. Information Processing & Management, 57(5), 102303. https://doi.org/10.1016/j.ipm.2020.102303
Anwar, C., Handijono, A., & Harits, A. (2025). Pemanfaatan penggunaan sosial media dengan bijak dalam teknologi informasi di era digital di SMK Media Informatika. Journal of Community Service Information System Synergy, 1(1), 71–77.
Anwar, C., Harits, A., & Handijono, A. (2025). Pemanfaatan media sosial dalam membangun identitas diri sebagai strategi personal branding (Studi kasus: SMKS IPTEK Tangerang Selatan). JIPM: Jurnal Inovasi Pengabdian Masyarakat, 3(1), 27–32.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT), 4171–4186. https://doi.org/10.18653/v1/N18-1045
Few, S. (2013). Information dashboard design: Displaying data for at-a-glance monitoring (2nd ed.). Burlingame, CA: Analytics Press.
Giachanou, A., & Crestani, F. (2016). Like it or not: A survey of Twitter sentiment analysis methods. ACM Computing Surveys, 49(2), 1–41. https://doi.org/10.1145/2938640
Gusman, D. V., Syafii, I., Satrio, B., Harits, A., Herindra, L. D., Sediyono, E., & Widodo, A. P. (2021). Pengaruh budaya dan lingkungan dalam menentukan keberhasilan implementasi sistem. SISTEMASI, 10(2), 258–267.
Knaflic, S. N. (2020). Storytelling with data: A data visualization guide for business professionals. Hoboken, NJ: Wiley.
Koto, F., Rahimi, A., Lau, J. H., & Baldwin, T. (2020). IndoLEM and IndoBERT: A benchmark dataset and pre-trained language model for Indonesian NLP. Proceedings of the 28th International Conference on Computational Linguistics (COLING), 757–770.
Kurniawan, D., & Azhari, S. N. (2019). Analisis sentimen media sosial berbahasa Indonesia menggunakan metode lexicon-based. Jurnal Teknologi Informasi dan Ilmu Komputer, 6(1), 89–96.
Liu, B. (2015). Sentiment analysis: Mining opinions, sentiments, and emotions. Cambridge: Cambridge University Press.
Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal, 5(4), 1093–1113. https://doi.org/10.1016/j.asej.2014.04.011
Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2(1–2), 1–135. https://doi.org/10.1561/1500000011
Sun, C., Huang, L., & Qiu, X. (2019). Utilizing BERT for aspect-based sentiment analysis. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing (EMNLP), 602–607.
Taboada, M., Brooke, J., Tofiloski, M., Voll, K., & Stede, M. (2011). Lexicon-based methods for sentiment analysis. Computational Linguistics, 37(2), 267–307. https://doi.org/10.1162/COLI_a_00049
Wilie, B., Vincentio, K., Winata, G. I., Cahyawijaya, S., Li, X., Lim, Z. Y., … Fung, P. (2020). IndoNLU: Benchmark and resources for evaluating Indonesian natural language understanding. Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 843–857.
Zhang, L., Wang, S., & Liu, B. (2018). Deep learning for sentiment analysis: A survey. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(4), e1253. https://doi.org/10.1002/widm.1253
Zimbra, D., Abbasi, A., Zeng, D., & Chen, H. (2018). The state-of-the-art in Twitter sentiment analysis. ACM Computing Surveys, 50(2), 1–37. https://doi.org/10.1145/3120343




