• Login
    View Item 
    •   Home
    • UNDERGRADUATE THESES (Koleksi Skripsi Sarjana)
    • UT-Faculty of Computer Science
    • View Item
    •   Home
    • UNDERGRADUATE THESES (Koleksi Skripsi Sarjana)
    • UT-Faculty of Computer Science
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Klasifikasi Genre Musik Indonesia Menggunakan Convolutional Neural Network dengan Mel Frequency Cepstral Coefficient Feature Extraction

    Thumbnail
    View/Open
    Perdana Putro Harwanto (2.016Mb)
    Date
    2025-01-21
    Author
    HARWANTO, Perdana Putro
    Metadata
    Show full item record
    Abstract
    Penelitian ini berfokus pada klasifikasi genre musik Indonesia dengan menerapkan metode pembelajaran mendalam, khususnya Convolutional Neural Network (CNN), menggunakan dua arsitektur berbeda, yaitu ResNet-50 dan VGG16. Untuk ekstraksi fitur, digunakan Mel Frequency Cepstral Coefficient (MFCC). Dataset yang digunakan terdiri atas 400 file audio berformat .wav dengan durasi 30 detik per file. Dataset ini mencakup empat genre musik Indonesia: Pop Indonesia, Keroncong, Dangdut, dan Campursari, masing-masing terdiri atas 100 file audio. Proses penelitian dimulai dengan pengumpulan data audio dari berbagai platform. Setiap file audio kemudian melalui proses ekstraksi fitur menggunakan MFCC. MFCC dipilih karena kemampuannya dalam merepresentasikan karakteristik spektral dari sinyal audio, yang sangat berguna dalam pengenalan pola pada data audio. Proses ekstraksi ini menghasilkan representasi numerik dari setiap file audio, yang kemudian digunakan sebagai input untuk model CNN. Setelah ekstraksi fitur, dataset dibagi menjadi data pelatihan dan data pengujian dengan tiga skenario berbeda, Skenario 80:20; 70:30; 60:40. Pembagian ini bertujuan untuk mengevaluasi konsistensi dan kinerja model pada proporsi data pelatihan dan pengujian yang berbeda. Model CNN kemudian dilatih menggunakan dua arsitektur yang berbeda: ResNet-50: Arsitektur ini dikenal dengan kedalamannya yang mencapai 50 lapisan dan penggunaan residual learning, yang membantu mengatasi masalah degradasi pada model yang sangat dalam. VGG-16: Arsitektur ini terdiri atas 16 lapisan dengan susunan yang lebih sederhana dibandingkan ResNet-50, namun tetap efektif dalam berbagai tugas klasifikasi citra. Setelah proses pelatihan, model dievaluasi menggunakan confusion matrix untuk mengukur kinerjanya dalam mengklasifikasikan genre musik. Confusion matrix memberikan informasi tentang jumlah prediksi benar dan salah untuk setiap kelas, sehingga memungkinkan perhitungan metrik evaluasi seperti akurasi, presisi, recall, dan F1- score. Hasil penelitian menunjukkan bahwa model ResNet-50 dengan MFCC mencapai akurasi tertinggi sebesar 99% pada skenario pembagian data 80:20. Sementara itu, model VGG-16 dengan MFCC mencapai akurasi tertinggi sebesar 97% pada skenario pembagian data 70:30. Meskipun perbedaan akurasi antara kedua model tidak signifikan, ResNet-50 secara konsisten menunjukkan performa yang lebih baik dibandingkan VGG-16 dalam mengklasifikasikan genre musik Indonesia. Berdasarkan hasil tersebut, dapat disimpulkan bahwa fitur ekstraksi MFCC berhasil diimplementasikan dengan baik pada kedua model CNN. MFCC mampu menangkap karakteristik penting dari sinyal audio yang relevan untuk tugas klasifikasi genre musik. Selain itu, arsitektur ResNet-50 menunjukkan keunggulan dalam memanfaatkan fitur-fitur yang diekstraksi oleh MFCC, sehingga menghasilkan performa yang lebih baik dibandingkan VGG-16. Untuk pengembangan penelitian selanjutnya, disarankan untuk meningkatkan jumlah dataset dan menambah variasi genre musik Indonesia. Penambahan jumlah data dan variasi genre diharapkan dapat meningkatkan generalisasi model dan akurasinya dalam mengklasifikasikan genre musik yang lebih beragam. Pengembangan lebih lanjut juga dapat diarahkan pada implementasi sistem rekomendasi musik yang dapat memberikan saran lagu kepada pengguna berdasarkan preferensi genre mereka. Integrasi dengan analisis citra wajah untuk mendeteksi emosi pengguna dan merekomendasikan musik yang sesuai dengan suasana hati juga merupakan area penelitian yang menarik. Pendekatan ini dapat meningkatkan pengalaman pengguna dalam menikmati musik dan memperluas aplikasi dari sistem klasifikasi genre musik yang telah dikembangkan.
    URI
    https://repository.unej.ac.id/xmlui/handle/123456789/125188
    Collections
    • UT-Faculty of Computer Science [1040]

    UPA-TIK Copyright © 2024  Library University of Jember
    Contact Us | Send Feedback

    Indonesia DSpace Group :

    University of Jember Repository
    IPB University Scientific Repository
    UIN Syarif Hidayatullah Institutional Repository
     

     

    Browse

    All of RepositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    Context

    Edit this item

    UPA-TIK Copyright © 2024  Library University of Jember
    Contact Us | Send Feedback

    Indonesia DSpace Group :

    University of Jember Repository
    IPB University Scientific Repository
    UIN Syarif Hidayatullah Institutional Repository