![]() Hasil eksperimen menunjukkan bahwa model GMM-HMM yang telah dibangun mampu melakukan klasifikasi usia-genderdengan akurasi hingga 96,4%. Model ini dapat diperbaiki dengan pengaturan parameter secara lebih presisi dan penggunaan dataset yang lebih besar. Pada penelitian ini, basisdata suara diambil dari situs Common Voice, yang berisi banyak posting blog, buku-buku lama, film, dan pidato publik lainnya. Terakhir, HMM diterapkan untuk mendeteksi genderdan kelompok usia. Selanjutnya, dilakukan pelatihan untuk menghasilkan model akustik untuk semua penutur (pria dan wanita dari berbagai usia) di dalam basisdata pelatihan. ![]() Pertama, dilakukan pembangunan vektor ciri menggunakan Mel-Frequency Cepstrum Coefficient (MFCC). Penelitian ini berfokus pada klasifikasi usia-gender berdasarkan suara pembicara menggunakan gabungan Gaussian Mixture Modeldan Hidden Markov Model(GMM-HMM). Pengelompokan usia yang berbeda dibagi menjadi tiga kelompok: anak, muda, menengah, dan senior berdasarkan rentang usia tertentu. Klasifikasi genderjuga telah diterapkan dalam pengenalan wajah, peringkasan video, penentuan tingkat izin yang berbeda untuk kelompok umur yang berbeda, dan lainnya. Klasifikasi usia-genderberdasarkan suara sangat berguna dalam perkenalan pidato dan dalam pengenalan emosi. ![]()
0 Comments
Leave a Reply. |
AuthorWrite something about yourself. No need to be fancy, just an overview. ArchivesCategories |