Sentiment Analysis Tweet Covid-19 Menggunakan RoBERTa
Keywords:
analisis sentimen, COVID-19, RoBERTa, transformers, tweet Bahasa IndonesiaAbstract
Penelitian ini bertujuan mengimplementasikan model transformer RoBERTa untuk analisis sentimen tweet berbahasa Indonesia terkait COVID-19. Dataset diperoleh dari Kaggle dengan 36.929 tweet berlabel positif, negatif, dan netral. Metode penelitian mencakup preprocessing (pembersihan teks, normalisasi, stemming), tokenisasi menggunakan Byte-Level BPE, fine-tuning model RoBERTa pre-trained (indolem/indobert-base-uncased), dan evaluasi menggunakan metrik akurasi, precision, recall, dan F1-score. Hasil eksperimen menunjukkan model mencapai akurasi 96,30% dengan F1-score tertimbang 0,96. Model menunjukkan kinerja optimal pada kelas netral (F1-score 0,98) dan tetap solid pada kelas minoritas negatif (F1-score 0,82). Keunggulan RoBERTa terletak pada kemampuan memahami konteks bahasa informal di Twitter melalui mekanisme self-attention, menjadikannya efektif untuk analisis opini publik berbasis data.
References
Agustiningsih, N., Purnomo, A. S., & Kurniawan, D. (2022). Analisis Sentimen Terhadap Vaksin Covid-19 Di Indonesia Menggunakan Algoritma Naïve Bayes Classifier. Jurnal Informatika, 8(2), 123-130.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics, 4171–4186.
Jupri, G. D., & Rosyani, P. (2022). AI Implementasi Artificial Intelligence Pada Sistem Manufaktur Terintegrasi. BISIK: Jurnal Ilmu Komputer, Hukum, Kesehatan Dan Sosial Humaniora, 1(2), 140–143.
Liu, Y., Ott, M., Goyal, N., Du, J., Joshi, M., Chen, D., Levy, O., Lewis, M., Zettlemoyer, L., & Stoyanov, V. (2019). RoBERTa: A Robustly Optimized BERT Pretraining Approach. arXiv preprint arXiv:1907.11692.
Nursyifa, A. A., & Gata, W. (2022). Analisis Sentimen Pengguna Twitter Terhadap Vaksinasi COVID-19 Menggunakan Algoritma Support Vector Machine. Jurnal Teknologi Informasi dan Komunikasi, 9(1), 36-43.
Prasetia, O., Machfud, S., Rosyani, P., & Agustian, B. (2025). Klasifikasi Gender Berbasis Citra Wajah Menggunakan Clustering Dan Deep Learning. Bulletin of Computer Science Research, 5(4), 770-777.
Purboyo, T. W., & Astuti, W. (2021). Analisis Sentimen Terhadap Penanganan Covid-19 Di Indonesia Pada Twitter Menggunakan Metode Naïve Bayes Classifier. e-Proceeding of Engineering, 8(5), 10839.
Ridho, M., Wibowo, A., & Saputra, D. (2024). Analisis Sentimen Tweet COVID-19 Menggunakan Metode LSTM. Jurnal Teknologi dan Sistem Informasi, 10(1), 45-52.
Rosenberg, H., Syed, S., & Rezaie, S. (2020). The Twitter pandemic: The critical role of Twitter in the dissemination of medical information and misinformation during the COVID-19 pandemic. Canadian Journal of Emergency Medicine, 22(4), 418–421.
Rosyani, P. (2017). Pengenalan Wajah Menggunakan Metode Principal Component Analysis (PCA) dan Canberra Distance. Jurnal Informatika Universitas Pamulang, 2(2), 118-121.
Rosyani, P., & Hariansyah, O. (2020). Pengenalan Citra Bunga Menggunakan Segmentasi Otsu Treshold dan Naïve Bayes. Jurnal Sistem dan Informatika (JSI), 15(1), 28–35.
Syahlanisyiam, M., & Rosyani, P. (2023). Sistem Pakar Diagnosa Penyakit Kulit Dengan Menggunakan Metode Forward Chaining. Jurnal Manajemen, Ekonomi, Hukum, Kewirausahaan, Kesehatan, Pendidikan Dan Informatika (MANEKIN), 1(4), 152–157.




