PENANGANAN OVERDISPERSI PADA PEMODELAN DATA CACAHAN MENGGUNAKAN REGRESI BINOMIAL NEGATIF PADA RCIM (ROW COLUMN INTERACTION MODEL)
Abstract
Regresi Poisson adalah model yang biasa digunakan untuk menganalisis hubungan antara variabel Y dan X pada data cacahan. Data cacahan seringkali mengalami nilai varians yang lebih besar dari rata-ratanya yang disebut overdispersi. Overdispersi pada data cacahan ini dapat menyebabkan nilai devians dari suatu model menjadi sangat besar. Nilai dispersi pada data cacahan dapat dideteksi dengan nilai devians yang dibagi db hasilnya bernilai lebih dari 1. Salah satu penanganan yang dapat dilakukan pada data cacahan yang mengalami overdispersi adalah menggunakan Regresi Binomial Negatif. Variabel respon pada Regresi Binomial Negatif tidak mengharuskan nilai varians sama dengan rata-ratanya.
Penelitian tentang Regresi Binomial Negatif dalam menangani overdispersi pada model aditif telah dilakukan oleh beberapa peneliti namun tidak untuk model multiplikatif. Model multiplikatif merupakan model yang melibatkan dua interaksi dalam tabel dua arah. Model GAMMI (Generalized AMMI) merupakan model yang sering digunakan untuk model multiplikatif. Model ini merupakan model dengan interaksi dimana pengaruh utama bersifat aditif dan pengaruh interaksi dimodelkan dengan model bilinier. Yee dan Hadi (2014) memperkenalkan Row Column Interaction Model (RCIM) yang merupakan perluasan dari konsep Reduced-Rank Vector Generalized Models (RR-VGLM). RCIM merupakan suatu model yang dapat diterapkan sama halnya dengan GAMMI yaitu dapat menganalisis tabel dua arah dengan matriks responnya bisa dalam bentuk cacahan (count). Kesamaan pada RCIM dan GAMMI yaitu terdapat pada pendugaannya yang sama-sama menggunakan metode pendugaan bolak-balik.
viii
Penelitian ini bertujuan untuk mengetahui penanganan overdispersi melalui distribusi Binomial Negatif pada Row Column Interaction Model (RCIM) dan suku multiplikatif atau rank model dengan kompleksitas rank pada model yang terbaik. Model terbaik antara Regresi Poisson dan Binomial Negatif dalam mengatasi overdispersi pada data cacahan akan memiliki nilai MSE (Mean Square Error) dengan nilai terkecil
Data yang digunakan dalam penelitian ini adalah dua buah data. Data pertama adalah data percobaan naungan yang memiliki 15 galur dan 8 genotipdan mengalami overdispersi. Data kedua adalah data pertama yang mengalami penambahan outlier hingga hampir 20%. Data ini akan divisualisasikan interaksinya ke dalam dimensi 2 (Biplot) melalui RCIM agar terlihat stabilitas genotype terhadap lingkungannya.
Penelitian yang dilakukan pada dua buah data tersebut diperoleh bahwa hasil analisis devians diperoleh dari suatu nilai residual devians yang didapatkan dari nilai log-likelihood. Hasil analisis devians yang didapatkan dari Regresi Poisson dan Regresi Binomial Negatif menunjukkan bahwa Regresi Binomial Negatif lebih baik dalam memodelkan data cacahan yang mengalami overdispersi. Nilai devians pada Regresi Binomial Negatif bernilai lebih kecil daripada Regresi Poisson yang menunjukkan bahwa Regresi Binomial Negatif lebih baik. Model RCIM pada data yang memiliki nilai dispersi dibawah untuk Regresi Poisson dan Regresi Binomial Negatif signifikan pada RCIM 2. Model RCIM pada data yang mengalami penambahan outlier untuk Regresi Poisson signifikan pada RCIM 3 sedangkan untuk Regresi Binomial Negatif signifikan pada RCIM 1. Hasil yang diperoleh dari biplot adalah galur 8 stabil pada semua lokasi