Penerapan Named Entity Recognition pada Teks Media Sosial Bahasa Indonesia Menggunakan BiLSTM-CRF

Authors

  • Ghatfani Muhammad Ilham Universitas Pamulang
  • Rahmat Santoso Universitas Pamulang
  • Sheril Lestari Universitas Pamulang
  • Perani Rosyani Universitas Pamulang

Keywords:

Named Entity Recognition, BiLSTM-CRF, NLP, Bahasa Indonesia, Media Sosial

Abstract

Named Entity Recognition (NER) merupakan salah satu tugas penting dalam Natural Language Processing (NLP) yang bertujuan untuk mengidentifikasi dan mengklasifikasikan entitas bernama seperti orang, lokasi, dan organisasi di dalam teks. Tantangan utama dalam penerapan NER pada bahasa Indonesia, khususnya pada data media sosial, terletak pada penggunaan bahasa tidak baku, singkatan, dan keberadaan noise teks. Penelitian ini mengusulkan penerapan model Bidirectional Long Short-Term Memory yang dikombinasikan dengan Conditional Random Field (BiLSTM-CRF) untuk melakukan NER pada teks bahasa Indonesia yang bersumber dari Twitter/X. Dataset yang digunakan berasal dari Kaggle dengan skema pelabelan BIO dan dibagi ke dalam data latih, validasi, dan uji. Tahapan penelitian meliputi preprocessing teks, pembangunan model BiLSTM-CRF, serta evaluasi performa menggunakan metrik precision, recall, dan F1- score. Hasil eksperimen menunjukkan bahwa model BiLSTM-CRF mampu mengenali entitas bernama dengan performa yang baik dan stabil pada data uji, sehingga pendekatan ini efektif untuk menangani karakteristik teks media sosial berbahasa Indonesia. Penelitian ini diharapkan dapat menjadi referensi bagi pengembangan sistem NER bahasa Indonesia pada data informal.

References

Amalia, R., Hidayati, T., Rosyani, P., Ikasari, I. H., Handayani, I., Yunita, D., Purnaningsih, P., & Tassia, S. E. (2020). GOOGLE CLASSROOM as a Collaborative Tool for Academics in Online Learning. Proceedings of the 3rd International Conference on Economic and Social Science (ICON- ESS). DOI:10.4108/eai.17-10-2018.2294317

Amnu Pramuditya, B., Farhan Maulana, M., & Rosyani, P. (2024). Literature Review: Pendekatan Multilayer Perceptron Untuk Klasifikasi Data Pasien Stroke . JRIIN :Jurnal Riset Informatika Dan Inovasi, 2(8), 1502–1508.

Angga Rakhmansyah, & Perani Rosyani. (2024). Literature Review: Klasifikasi Penyakit Paru-paru Menggunakan Metode Decision Tree. OKTAL : Jurnal Ilmu Komputer Dan Sains, 3(10), 2572– 2577.

Christanti, A. K., & Rachman, I. (2023). Indonesian NER using BiLSTM-CRF: A comparative study. Procedia Computer Science, 216, 555–563.

Gao, H., & Fu, J. (2021). Improved CRF training for sequence labeling. Pattern Recognition, 118, 108007.

Liu, Q., & Zhang, Y. (2020). Neural CRF models. ACL Anthology.

Purwarianti, A., & Janitra, D. (2021). Named entity recognition for Indonesian conversational text using BERT. ICoICT.

Rachman, A. F., & Adriani, M. (2020). Indonesian NER on noisy Twitter text. Proceedings of the 34th Pacific Asia Conference on Language, Information and Computation.

Rahmat, S. (2021). Analisis Prediksi Presensi Akademik Siswa Menggunakan Mechine Learn. JATIMIKA: Jurnal Kreativitas Mahasiswa Informatika, 1(3). Retrieved.

Rosyani, P. ., Febrianto, A., Reza Zakaria, A., Gilang Ramadhan, N., & Maulana, Z. (2024). Jumlah Kepala Sekolah Dan Guru Menurut Kelompok Umur Provinsi Aceh, Jawa Barat, Sulawesi Utara, Dan Kalimantan Barat Tahun 2023/2024. LOGIC : Jurnal Ilmu Komputer Dan Pendidikan, 2(6), 969–980.

Saputri, M., & Widyaningrum, I. P. (2022). Improving NER on Indonesian social media text using data cleaning. Jurnal Ilmiah Komputasi, 21(3), 200–210.

Downloads

Published

2025-12-25

How to Cite

Ilham, G. M., Santoso, R., Lestari, S., & Rosyani, P. (2025). Penerapan Named Entity Recognition pada Teks Media Sosial Bahasa Indonesia Menggunakan BiLSTM-CRF. AI Dan SPK : Jurnal Artificial Intelligent Dan Sistem Penunjang Keputusan, 3(2), 252–257. Retrieved from https://jurnalmahasiswa.com/index.php/aidanspk/article/view/3290

Most read articles by the same author(s)

<< < 1 2 3 

Similar Articles

1 2 3 > >> 

You may also start an advanced similarity search for this article.