Pemodelan Regresi Semiparametrik GAMLSS dengan Pemulusan Penalized Spline Menggunakan Web Interaktif
Abstract
Generalized Additive Model for Location, Scale, and Shape (GAMLSS) adalah suatu model yang dapat diterapkan untuk memodelkan data secara semi parametrik dengan empat parameter distribusi yaitu parameter lokasi ( ), skala ( ), dan shape yaitu skewness ( ), dan kurtosis ( ). GAMLSS merupakan perluasan dari GAM, oleh karena itu pada model ini juga menyediakan smoothing untuk variabel prediktor yang dimodelkan dengan non parametrik. Kelebihan GAMLSS daripada GAM variabel respon berasal dari distribusi keluarga eksponensial dan tambahan distribusi-distribusi lain.
Pada penelitian ini dibahas mengenai pemodelan GAMLSS dengan menggunakan web interaktif. Tujuan penelitian ini membuat web interaktif dengan menggunakan R-shiny sehingga seorang statistikawan dapat dengan mudah menganalisis data ataupun memodelkan data menggunakan GAMLSS. Data yang dianalisis pada penelitian ini adalah data kematian akibat penyakit demam berdarah di 33 provinsi di Indonesia sebagai variabel respon ( ). Data kematian akibat penyakit demam berdarah ini merupakan data sekunder yang didapatkan dari Profil Kesehatan Indonesia Tahun 2013.
Hasil dari penelitian ini ada dua yaitu web interaktif yang dapat diakses di alamat http://statslab-rshiny.fmipa.unej.ac.id/JORS/GAMLSS/ dan hasil estimasi parameter distribusi. program GAMLSS yang dibuat berbasis web interaktif memiliki fitur web berupa, scatterplot, pilihan menu data, pilihan pemulusan (pb(), lo(), cs(), dan ps()), pilihan formula location, scale dan shape, pilihan, pilihan span untuk local regression (loess), pilihan degree untuk loess, adanya term.plot ( ), worm plot, dan histogram distribusi. Kelebihan web interaktif yang dibuat yaitu bersifat tutorial selain user membaca teori dapat langsung mengaplikasikan data yang disiapkan ataupun data yang dipersiapkan oleh user, lebih praktis ketika mengubah formula daripada menggunakan R. Kekurangan dari web interaktif ini masih belum ada menu posisi knot, pilihan derajat polinomial dan pengaturan, pemulusan yang digunakan masih beberapa dari keluarga spline dan loess saja, bagian non parametrik yang dimodelkan hanya satu variabel prediktor, pada bagian, hanya dimodelkan variabel linier saja (tidak ada pemulusan dan tidak ada kombinasi variabel prediktor), masih belum termodelkan secara polinomial dan pemulusan hanya termodifikasi satu variabel prediktor. Hasil analisis pemodelan GAMLSS pemulusan penalized spline pada penelitian ini didapatkan distribusi terbaik adalah NBII, jumlah terbaik yaitu, dan parameter distribusi scale dimodelkan dengan. Model terbaik untuk data kematian akibat demam berdarah adalah dan model dari adalah dengan masing-masing dan adalah banyak kasus gizi buruk (jiwa), jumlah kabupaten / kota yang terjangkit penyakit demam berdarah (persen), jumlah rumah tangga sehat dan bersih (persen), dan jumlah puskesmas (bangunan).