Prediksi Cacat Perangkat Lunak Menggunakan Bi-LSTM dengan Teknik Oversampling SMOTE dan Representasi AST
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Fakultas Ilmu Komputer
Abstract
Cacat perangkat lunak merupakan salah satu permasalahan utama dalam pengembangan sistem yang andal dan berkualitas tinggi. Ketidakseimbangan data, yakni jumlah modul tidak cacat yang jauh lebih banyak dibandingkan modul cacat, menjadi tantangan signifikan dalam membangun model prediksi yang akurat. Penelitian ini bertujuan untuk mengatasi permasalahan tersebut dengan mengembangkan model prediksi cacat perangkat lunak menggunakan pendekatan deep learning Bidirectional Long Short-Term Memory (Bi-LSTM) yang dikombinasikan dengan teknik oversampling Synthetic Minority Over-sampling Technique (SMOTE). Model ini diharapkan mampu mengenali pola sekuensial dari metrik perangkat lunak serta mengatasi distribusi kelas yang tidak seimbang. Selain itu, penelitian ini juga berupaya mengintegrasikan representasi semantik kode sumber melalui Abstract Syntax Trees (AST) sebagai fitur tambahan dalam proses prediksi. Namun demikian, karena keterbatasan pada dataset NASA MDP: CM1, PC2, dan KC3 yang tidak menyediakan file kode sumber asli, proses ekstraksi AST tidak dapat dilaksanakan secara optimal. Meskipun demikian, AST tetap dianggap sebagai pendekatan yang potensial untuk penelitian selanjutnya, khususnya apabila tersedia dataset yang memuat kode sumber dalam format mentah. Model dievaluasi dengan membandingkan dua skenario, yakni model Bi-LSTM dan model Bi-LSTM yang dikombinasikan dengan SMOTE. Evaluasi dilakukan menggunakan metrik klasifikasi biner, yaitu accuracy, precision, recall, dan F1score. Hasil eksperimen menunjukkan bahwa penggabungan Bi-LSTM dan SMOTE memberikan peningkatan performa yang signifikan dibandingkan dengan penggunaan Bi-LSTM secara murni. Model yang dikembangkan terbukti lebih efektif dalam mendeteksi modul cacat, khususnya pada dataset yang memiliki tingkat ketidakseimbangan tinggi. Penelitian ini menunjukkan bahwa integrasi antara model sekuensial dan teknik penyeimbangan data dapat menjadi solusi yang lebih tepat dalam menyelesaikan permasalahan prediksi cacat perangkat lunak.
Description
Reupload file repositori 9 februari 2026_PKL Fani/Firli
