Show simple item record

dc.contributor.authorIRSYAD, Dzul Fikri
dc.date.accessioned2024-06-11T04:37:31Z
dc.date.available2024-06-11T04:37:31Z
dc.date.issued2024-01-16
dc.identifier.nim192410103050en_US
dc.identifier.urihttps://repository.unej.ac.id/xmlui/handle/123456789/121319
dc.description.abstractManusia memiliki faktor pembeda antara manusia yang satu dan manusia yang lain, dan salah satu faktor khas tersebut adalah suara mereka. Bidang mempelajari cara mengidentifikasi suara individu dikenal sebagai pengenalan pembicara. Namun, pengenalan pembicara menghadapi tantangan akibat faktor-faktor seperti kualitas rekaman yang bervariasi, pengaruh lingkungan, dan variasi nada saat berbicara. Ekstraksi fitur yang relevan menjadi sangat penting dalam mengatasi tantangan-tantangan ini, dengan metode seperti MFCC dan LPC memainkan peran kunci dalam menangkap karakteristik yang khas dari setiap suara. Langkah yang dilakukan dengan pengekstrakan sebuah data menggunakan metode yang sudah disebutkan. Setelah ekstraksi fitur, langkah berikutnya melibatkan pemecahan data menjadi beberapa bagian untuk data latih dan tes kemudian data akan pemilihan model, dalam sebuah model, model yang digunakan adalah model deep learning. Dalam pengenalan pembicara deep learning memiliki dua pendekatan: pertama, menganggap seluruh jaringan sebagai pengambil keputusan dengan menggunakan fungsi aktivasi seperti softmax untuk klasifikasi. Pendekatan kedua melibatkan pembelajaran mendalam sebagai ekstraktor embedding, meninggalkan pengambilan keputusan pada metrik seperti cosine similarity atau PLDA, dengan triplet loss function sebagai contoh fungsi yang digunakan untuk melatih model. Penelitian ini bertujuan mengungkap dampak penggabungan fitur dan penggunaan model triplet loss dalam pengenalan pembicara. Hasil menunjukkan bahwa penggabungan dua fitur mengurangi waktu latih, meningkatkan akurasi coverage, dan meminimalkan loss. Meskipun model deep learning base melampaui model triplet dalam hal akurasi, namun model triplet terbukti menguntungkan untuk menerima label baru tanpa perlu pelatihan ulang.en_US
dc.description.sponsorshipPembimbing Utama Muhamad Arief Hidayat M.Kom. Pembimbing Anggota Tio Dharmawan S.kom, M.Kom.en_US
dc.language.isootheren_US
dc.publisherFakultas Ilmu Komputeren_US
dc.subjectMFCCen_US
dc.subjectLPCen_US
dc.subjectIstm Triplet Lossen_US
dc.subjectPemodelan Speaker Recognitionen_US
dc.titlePemodelan Pengenalan Pembicara Bahasa Indonesia Menggunakan Stacking Fitur MFCC dan LPC dengan LSTM Triplet Lossen_US
dc.typeSkripsien_US
dc.identifier.prodiInformatikaen_US
dc.identifier.pembimbing1Muhamad Arief Hidayat M.Kom.en_US
dc.identifier.pembimbing2Tio Dharmawan S.kom, M.Kom.en_US
dc.identifier.validatorKacung- 23 April 2024en_US
dc.identifier.finalization0a67b73d_2024_06_tanggal 11en_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record