Clustering Pelanggan Supermarket Menggunakan K-Means dan PCA untuk Segmentasi Pelanggan
Keywords:
Segmentasi Pelanggan, K-Means, PCA, Clustering, Data MiningAbstract
Segmentasi pelanggan merupakan langkah penting dalam strategi pemasaran ritel berbasis data. Supermarket memiliki karakteristik pelanggan yang beragam sehingga diperlukan metode analisis yang mampu mengelompokkan pelanggan secara objektif dan akurat. Penelitian ini bertujuan untuk melakukan segmentasi pelanggan supermarket menggunakan algoritma K-Means yang dikombinasikan dengan Principal Component Analysis (PCA). Dataset yang digunakan berisi atribut perilaku belanja pelanggan seperti usia, frekuensi transaksi, dan total pengeluaran. Tahapan penelitian meliputi preprocessing data, normalisasi fitur, reduksi dimensi menggunakan PCA, penentuan jumlah cluster optimal dengan Elbow Method dan Silhouette Score, serta visualisasi hasil clustering. Hasil penelitian menunjukkan bahwa jumlah cluster optimal adalah empat cluster 0,284 yang menunjukkan kualitas pengelompokan pada kategori cukup. PCA berhasil mereduksi dimensi data menjadi dua komponen utama tanpa menghilangkan informasi penting serta mempermudah visualisasi cluster. Segmentasi yang dihasilkan mampu memberikan insight mengenai karakteristik pelanggan yang dapat dimanfaatkan sebagai dasar pengambilan keputusan strategis dalam pemasaran supermarket.
References
Abdi, H., & Williams, L. J. (2010). Principal component analysis. Wiley Interdisciplinary Reviews: Computational Statistics, 2(4), 433–459.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques (3rd ed.). Morgan Kaufmann.
Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern Recognition Letters, 31(8), 651–666.
MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 281–297.
Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65.




