Klasifikasi Penyakit Kardiovaskular dengan Ensemble Stacking Menggunakan Catboost sebagai Meta-learner
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Fakultas Ilmu Komputer
Abstract
Penyakit kardiovaskular (CVD) merupakan salah satu penyebab utama
kematian di seluruh dunia, sehingga deteksi dini menjadi krusial untuk mencegah
komplikasi yang lebih serius. Kemajuan dalam machine learning, khususnya
metode ensemble learning, menawarkan potensi besar untuk meningkatkan akurasi
prediksi penyakit. Penelitian ini bertujuan untuk mengukur dan mengoptimalkan
performa model klasifikasi penyakit kardiovaskular menggunakan pendekatan
ensemble stacking. Model yang diusulkan mengombinasikan empat base-learner
(Extra-tree, XGBoost, LightGBM, AdaBoost) dengan CatBoost sebagai metalearner. Penelitian ini menggunakan tiga dataset publik, yaitu Cardiovascular
Study Dataset, Cardiovascular-Disease-Dataset, dan Heart Disease Dataset, yang
masing-masing melalui tahap pre-processing data yang disesuaikan, termasuk
penanganan missing value, outlier, data duplikat, dan ketidakseimbangan kelas.
Hasil penelitian dengan parameter default menunjukkan performa unggul pada
Cardiovascular Study Dataset dengan akurasi 0,9751, meningkat signifikan (9-
17%) dibanding penelitian sebelumnya. Pada Cardiovascular-Disease Dataset,
performa meningkat sekitar 1-1,5% , namun menurun pada Heart Disease Dataset
yang berukuran lebih kecil. Proses optimasi parameter ensemble stacking (cv,
stack_method, passthrough) berhasil meningkatkan performa pada ketiga dataset,
dengan peningkatan akurasi tertinggi pada Heart Disease Dataset sebesar 4%
(mencapai 0,9007) dan pada Cardiovascular Study Dataset mencapai 0,9801.
Penelitian ini menyimpulkan bahwa model ensemble stacking dengan CatBoost
sebagai meta-learner menghasilkan performa yang bagus terutama pada dataset
berukuran besar dan optimasi parameter memberikan peningkatan performa yang
konsisten.
Description
Reupload File Repositori 5 Februari 2026_Rudy K/Lia
