Model Prediktif dan Identifikasi Faktor Utama Risiko Stroke Menggunakan Regresi Logistik Biner dan Support Vector Machine
Abstract
Secara global stroke menjadi penyebab ke-2 kematian dan penyebab ke-3
disabilitas. Prediksi stroke secara akurat dan mengenali faktor yang berpotensi pada
prediksi adalah salah satu cara pencegahan penyakit stroke. Klasifikasi dengan
pembelajaran mesin memiliki tujuan untuk memprediksi kelas kategori berdasarkan
pengamatan data sebelumnya. Penelitian ini bertujuan mendapatkan perbandingan
performa metode Regresi Logistik Biner dan Support Vector Machine kernel linear
dalam klasifikasi data stroke dan mengidentifikasi faktor utama yang berpengaruh
secara signifikan pada prediksi status stroke pasien. Hasil yang diperoleh
menunjukkan performa metode Support Vector Machine kernel linear lebih baik
dalam mengklasifikasi data stroke dengan nilai AUC 0,739. Sementara performa
metode Regresi Logistik Biner dalam mengklasifikasi data stroke memiliki nilai AUC
0,705. Faktor yang berpengaruh pada model Support Vector Machine kernel linear
dan model Regresi Logistik Biner dalam prediksi stroke yaitu kadar glukosa,
hipertensi, penyakit jantung, dan status menikah.