Implementasi FastText untuk Klasifikasi Bahasa Multilingual: Pendekatan Efisien dalam Sistem Pemrosesan Bahasa Alami (NLP)

Authors

  • Devin Slamet Universitas Pamulang
  • Heri Purnomo Universitas Pamulang
  • Muhammad Listanto Universitas Pamulang
  • Reni Anggariani Universitas Pamulang
  • Perani Rosyani Universitas Pamulang

Keywords:

FastText, NLP, klasifikasi bahasa, machine learning, multilingual

Abstract

Klasifikasi bahasa merupakan salah satu tugas dasar dalam pemrosesan bahasa alami (Natural Language Processing/NLP) yang berfungsi untuk mendeteksi bahasa dari suatu teks. Tugas ini menjadi semakin penting seiring meningkatnya penggunaan aplikasi multilingual seperti chatbot, platform digital global, dan sistem moderasi konten. Penelitian ini mengimplementasikan FastText sebagai model klasifikasi untuk mengidentifikasi bahasa menggunakan dataset multilingual dari Kaggle. FastText dipilih karena kemampuannya dalam memanfaatkan karakter n-gram dan subword representation, sehingga tetap mampu memberikan prediksi yang presisi meskipun teks yang digunakan sangat pendek atau memiliki variasi penulisan. Proses penelitian meliputi tahapan preprocessing teks, konversi label ke format FastText, pelatihan model, pengujian, serta evaluasi menggunakan metrik akurasi, precision, recall, F1-score, dan confusion matrix. Hasil evaluasi menunjukkan bahwa model FastText mampu mencapai akurasi lebih dari 90% dengan waktu pelatihan yang ringkas dan efisien. Temuan ini menegaskan bahwa FastText merupakan solusi praktis dan ringan untuk kebutuhan deteksi bahasa otomatis dalam skala besar. Selain itu, penelitian ini memberikan gambaran mengenai bagaimana metode klasifikasi berbasis embedding seperti FastText dapat diterapkan pada dataset multilingual dengan struktur yang beragam. Implementasi FastText dalam proyek ini menunjukkan bahwa pendekatan yang sederhana namun efektif tetap mampu memberikan performa kompetitif untuk tugas-tugas dasar NLP, sehingga dapat dijadikan referensi bagi pengembangan sistem NLP lain yang memerlukan tahap deteksi bahasa sebagai bagian awal pemrosesan. Di samping hasil performa yang baik, penelitian ini juga menunjukkan bahwa proses implementasi FastText relatif mudah dilakukan, sehingga cocok digunakan baik oleh pemula maupun pengembang yang membutuhkan solusi cepat untuk klasifikasi bahasa. Pendekatan ini dapat menjadi dasar bagi pengembangan model NLP yang lebih kompleks dan mendalam di masa mendatang.

References

Ahmed, M., & Rahman, T. (2020). A Review of Subword Embedding Techniques for Multilingual NLP. International Journal of Computer Science Research.

Alshaiba, R., & Mahmoud, B. (2024). Comparative Performance of FastText and Transformer Models in Language Detection Tasks. International Journal of Artificial Intelligence Systems.

Chandra, S., & Iyer, M. (2020). A Comprehensive Survey of Language Detection Algorithms. International Journal of AI Research.

Kaggle. (2023). Multilingual Text Classification Dataset. Kaggle.com.

Khan, S., & Gupta, R. (2022). Lightweight Approaches for Multilingual Language Identification Using Subword Embeddings. Journal of Natural Language Engineering.

Kim, J., & Park, H. (2022). Improving Language Identification Using N-gram Enhanced Embedding Models. Journal of Digital Language Processing.

Lestari, D., & Haris, A. (2022). Evaluasi Model FastText untuk Identifikasi Bahasa pada Media Sosial. Jurnal Sains Komputer Indonesia.

Meta AI Research. (2021). FastText: Efficient Learning of Word Representations. Meta Platforms, Inc.

Meta AI. (2022). FastText Documentation. fasttext.cc.

Suryana, F., & Putra, R. (2024). Penerapan FastText dan Analisis Confusion Matrix untuk Deteksi Bahasa Otomatis. Jurnal Teknologi dan Sistem Informasi.

Downloads

Published

2025-12-29

How to Cite

Slamet, D., Purnomo, H., Listanto, M., Anggariani, R., & Rosyani, P. (2025). Implementasi FastText untuk Klasifikasi Bahasa Multilingual: Pendekatan Efisien dalam Sistem Pemrosesan Bahasa Alami (NLP). JRIIN :Jurnal Riset Informatika Dan Inovasi, 3(9), 2489–2497. Retrieved from https://jurnalmahasiswa.com/index.php/jriin/article/view/3489

Most read articles by the same author(s)

1 2 3 4 5 6 7 8 9 10 > >> 

Similar Articles

1 2 3 4 5 6 7 8 9 10 > >> 

You may also start an advanced similarity search for this article.