Pengenalan Wajah Emosi Menggunakan CNN dan Ekstraksi Fitur HOG
Keywords:
pengenalan emosi wajah, FER-2013, CNN, klasifikasi citra, Grad-CAMAbstract
Pengenalan emosi wajah merupakan komponen penting dalam visi komputer karena mendukung interaksi manusia–komputer, analisis perilaku, serta pengembangan sistem cerdas berbasis persepsi visual. Namun, performa model pada dataset umum seperti FER-2013 sering terhambat oleh variasi pencahayaan, resolusi rendah, ketidakseimbangan kelas, dan potensi noise pada label. Penelitian ini mengusulkan pengembangan arsitektur Convolutional Neural Network (CNN) yang dioptimasi untuk meningkatkan akurasi dan kemampuan generalisasi dalam klasifikasi emosi wajah. Pendekatan yang digunakan mencakup preprocessing citra grayscale 48×48 piksel, augmentasi data, penerapan class weighting, serta modifikasi arsitektur dengan Batch Normalization, LeakyReLU, Global Average Pooling, dan Dropout. Model dievaluasi menggunakan akurasi, F1-score, confusion matrix, dan visualisasi Grad-CAM untuk menilai interpretabilitas. Hasil eksperimen menunjukkan bahwa model yang diusulkan mencapai akurasi pengujian 56–58% dan weighted F1-score 0,55–0,58, meningkat signifikan dibandingkan model baseline CNN (41–42%) maupun pendekatan HOG+SVM (35–40%). Analisis menunjukkan peningkatan kinerja pada kelas minor, sementara Grad-CAM mengonfirmasi bahwa model memfokuskan perhatian pada area wajah relevan seperti mata dan mulut. Temuan ini membuktikan bahwa arsitektur CNN ringan yang dioptimasi mampu memberikan performa lebih stabil pada dataset berkualitas rendah dan tidak seimbang, serta menjadi dasar bagi pengembangan model lanjutan berbasis transfer learning dan attention mechanism.
References
Cao, J., Meng, Z., & He, X. (2021). Class imbalance learning in deep neural networks: A systematic review. Neurocomputing, 452, 708–726. https://doi.org/10.1016/j.neucom.2021.05.021
Khaireddin, Y., & Chen, Z. (2021). Facial emotion recognition: State-of-the-art performance on FER-2013. IEEE Access, 9, 76944–76959. https://doi.org/10.1109/ACCESS.2021.3081433
Khan, S., Naseer, M., & Hayat, M. (2022). Transformers in vision: A survey. ACM Computing Surveys, 54(10), 1–41. https://doi.org/10.1145/3505244
Kumar, A., & Sharma, D. (2020). Facial expression recognition using convolutional neural networks: A survey. Applied Sciences, 10(23), 8355. https://doi.org/10.3390/app10238355
Samek, W., Montavon, G., & Müller, K.-R. (2021). Explainable artificial intelligence: Interpreting deep learning models. IEEE Signal Processing Magazine, 38(3), 40–48. https://doi.org/10.1109/MSP.2021.3051999
Tjoa, E., & Guan, C. (2020). A survey on explainable artificial intelligence (XAI). IEEE Transactions on Neural Networks and Learning Systems, 32(11), 4793–4813. https://doi.org/10.1109/TNNLS.2020.3027314




