Perbandingan Algoritma Random Forest, Naive Bayes, dan Logistic Regression untuk Klasifikasi Penyakit Stroke
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Fakultas Ilmu Sosial dan Ilmu Politik
Abstract
Penyakit stroke merupakan salah satu penyebab utama kematian dan
kecacatan di seluruh dunia, yang umumnya terjadi akibat penyumbatan atau
pecahnya pembuluh darah di otak. Deteksi dini menjadi sangat krusial untuk
mencegah komplikasi serius, namun kompleksitas data medis masih menjadi
tantangan dalam menghasilkan prediksi yang akurat.
Penelitian ini bertujuan untuk membandingkan kinerja tiga algoritma
pembelajaran mesin, yaitu Random Forest, Naive Bayes, dan Logistic Regression
dalam melakukan klasifikasi penyakit stroke. Dataset yang digunakan diperoleh
dari platform Kaggle dan mencakup 5110 data pasien dengan 11 atribut, seperti
usia, jenis kelamin, status merokok, dan kadar glukosa. Untuk mengatasi
ketidakseimbangan data, metode SMOTE diterapkan, sedangkan pendekatan
feature importance digunakan untuk menganalisis kontribusi setiap atribut terhadap
hasil klasifikasi.
Penerapan feature importance dan tuning hyperparameter terbukti mampu
meningkatkan kinerja model secara keseluruhan, meskipun memerlukan waktu
pemrosesan yang lebih lama. Dari hasil pengujian, algoritma Random Forest
menunjukkan kinerja paling optimal dalam klasifikasi penyakit stroke, dengan
akurasi sebesar 93,47%, presisi 90,35%, recall 97,33%, dan F1-score 93,71%,
diikuti oleh Logistic Regression dan Naive Bayes.
Penelitian ini diharapkan dapat memberikan kontribusi dalam
pengembangan sistem pendeteksian penyakit stroke yang lebih efektif dan akurat
di masa mendatang.
Description
Reuploud file repositori 11 maret 2026_Firli
