Penggunaan Pre-Trained Convolutional Neural Networks dan Explainable AI dalam Klasifikasi Penyakit Alzheimer Berdasarkan Citra MRI Otak
Abstract
Penyakit Alzheimer adalah penyakit yang menyebabkan kematian pada
sel-sel saraf otak dan menurunkan volume otak seiring berjalannya waktu.
Penyakit Alzheimer memiliki lima tahapan perkembangannya, yaitu tahap
preclinical, mild cognitive impairment (MCI), mild, moderate dan severe
demented. Pencitraan otak menggunakan magnetic resonance imaging (MRI)
adalah metode diagnosis awal yang umum dilakukan. Akan tetapi, pembacaan
citra MRI dilakukan secara subjektif oleh para ahli sehingga membuang waktu
dan melelahkan.
Convolutional Neural Networks (CNN) telah banyak digunakan untuk
tujuan pembacaan citra medis dan memiliki rata-rata akurasi klasifikasi citra
terbaik dibandingkan metode-metode lainnya. Berlawanan dengan
keunggulannya, CNN juga memiliki kelemahan, yaitu terbatasnya ketersediaan
dataset dalam bidang medis dan sifat black box yang dimiliki oleh CNN.
Terbatasnya ketersediaan data dapat diatasi dengan memanfaatkan augmentasi
dataset dan transfer learning arsitektur CNN yang telah ada. Sifat black box CNN
dapat diatasi dengan menggunakan explainable AI (XAI) untuk dapat
memberikan penjelasan visual terkait area pada citra yang memengaruhi model
melakukan klasifikasi. Penjelasan visual tersebut berupa heatmap pada citra.
Penelitian ini bertujuan untuk membuat model-model pre-trained CNN
yang dapat melakukan klasifikasi citra MRI otak Alzheimer dan menghasilkan
visualisasi heatmap yang menjadi fokus model dalam melakukan klasifikasi
menggunakan XAI. Dataset yang digunakan berasal dari website Kaggle
(www.kaggle.com/datasets/tourist55/alzheimers-dataset-4-class-of-images).
Dalam penelitian diterapkan berbagai teknik augmentasi data untuk
memperbanyak dataset, transfer learning pre-trained CNN (DenseNet121,EfficientNetB0, EfficientNetB2, dan ResNet50) dari library Keras, dan
penggunaan XAI Grad-CAM dari library Keras. Teknik augmentasi data
digunakan untuk memperbanyak dan menyeimbangkan dataset yang digunakan
sesuai kebutuhan penelitian ini. Agar hasil yang diberikan model semakin
meyakinkan, dataset dibagi menggunakan stratified 5-folds. Masing-masing
arsitektur DenseNet121, EfficientNetB0, EfficientNetB2, dan ResNet50 dibuat
menjadi 5 model sama persis untuk mengerjakan setiap fold yang dihasilkan.
Hasil training dan testing kelima model dari setiap arsitektur dirata-rata dan
dibandingkan hasilnya. Hasil yang didapatkan ada nilai akurasi, precision, recall,
dan F1-score. Setelah training dan testing selesai, model dengan akurasi test
tertinggi dari setiap arsitektur digunakan bersama Grad-CAM untuk menghasilkan
visualisasi heatmap pada citra.
Hasil pertama dari penelitian ini adalah berdasarkan rata-rata akurasi test,
model terbaik dalam penelitian ini adalah DenseNet121 dengan rata-rata akurasi
test, precision test, recall test, dan f1-score test berturut-turut 98,2%, 98,9%,
98,3%, dan 98,6%. Arsitektur EfficientNetB0 mendapatkan rata-rata akurasi test,
precision test, recall test, dan f1-score test berturut-turut 97,8%, 98,4%, 98,1%,
dan 98,3%. Arsitektur EfficientNetB2 mendapatkan rata-rata akurasi test,
precision test, recall test, dan f1-score test berturut-turut 97,5%, 97,9%, 97,1%,
dan 97,5%. Arsitektur ResNet50 mendapatkan rata-rata akurasi test, precision test,
recall test, dan f1-score test berturut-turut 97,9%, 98,6%, 98,2%, dan 98,4%.
Hasil kedua dari penelitian ini adalah memberikan visualisasi area yang
memengaruhi tiap model berbeda-beda. Tidak semua model menghasilkan
visualisasi yang mudah dipahami. Heatmap DenseNet121 dan EfficientNetB0
dapat menunjukkan area pada citra untuk setiap kelas yang menjadi fokus model
dalam melakukan klasifikasi. Heatmap EfficientNetB2 tidak dapat menunjukkan
area pada citra untuk setiap kelas sehingga tidak dapat diketahui mana yang
menjadi fokus model. Heatmap ResNet50 memberikan hanya memberikan
visualisasi yang jelas pada kelas very mild demented dan moderate demented saja.
Secara umum, visualisasi yang didapatkan belum cukup baik. Hasil visualisasi
antar citra dalam satu kelas yang sama juga tidak seragam.