Perbandingan Algoritma Random Forest, Naive Bayes, dan Logistic Regression untuk Klasifikasi Penyakit Stroke

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Fakultas Ilmu Sosial dan Ilmu Politik

Abstract

Penyakit stroke merupakan salah satu penyebab utama kematian dan kecacatan di seluruh dunia, yang umumnya terjadi akibat penyumbatan atau pecahnya pembuluh darah di otak. Deteksi dini menjadi sangat krusial untuk mencegah komplikasi serius, namun kompleksitas data medis masih menjadi tantangan dalam menghasilkan prediksi yang akurat. Penelitian ini bertujuan untuk membandingkan kinerja tiga algoritma pembelajaran mesin, yaitu Random Forest, Naive Bayes, dan Logistic Regression dalam melakukan klasifikasi penyakit stroke. Dataset yang digunakan diperoleh dari platform Kaggle dan mencakup 5110 data pasien dengan 11 atribut, seperti usia, jenis kelamin, status merokok, dan kadar glukosa. Untuk mengatasi ketidakseimbangan data, metode SMOTE diterapkan, sedangkan pendekatan feature importance digunakan untuk menganalisis kontribusi setiap atribut terhadap hasil klasifikasi. Penerapan feature importance dan tuning hyperparameter terbukti mampu meningkatkan kinerja model secara keseluruhan, meskipun memerlukan waktu pemrosesan yang lebih lama. Dari hasil pengujian, algoritma Random Forest menunjukkan kinerja paling optimal dalam klasifikasi penyakit stroke, dengan akurasi sebesar 93,47%, presisi 90,35%, recall 97,33%, dan F1-score 93,71%, diikuti oleh Logistic Regression dan Naive Bayes. Penelitian ini diharapkan dapat memberikan kontribusi dalam pengembangan sistem pendeteksian penyakit stroke yang lebih efektif dan akurat di masa mendatang.

Description

Reuploud file repositori 11 maret 2026_Firli

Citation

Endorsement

Review

Supplemented By

Referenced By