RANCANG BANGUN DATA WAREHOUSE DAN R STUDIO SERTA PEMANFAATANNYA DALAM PERAMALAN POLA KONSUMSI MASYARAKAT DI KABUPATEN JEMBER
Abstract
R adalah salah satu dari program sumber terbuka yang dapat diunduh gratis
, kini R dikembangkan sebagai upaya kolaborasi pakar-pakar statistik dan komputer
di seluruh dunia. R diluncurkan pertama kali tahun 1997, dan versi terakhir ketika
tulisan ini dibuat adalah 3.1.0. Bagi sebagian pengguna yang terbiasa mengguna
GUI dengan sistem menu, R juga menyediakan banyak GUI yang berbasiskan
sistem menu, antara lain R Studio, Tinn-R, R Commander dan bayak lagi yang
lainnya, dan dapat diunduh gratis juga. Perancangan data warehouse mengikuti
data yang dihasilkan dari data SUSENAS, pola pembentukan tabel akan mengikuti
pola dari data SUSENAS. Data warehouse mempunyai kemampuan dalam impor
dan ekspor data serta mempunyai kemampuan query data.
Implementasi R Studio berbasis web, menggunakan paket R yang telah
tersedia dengan mengkombinasikan dengan data warehouse, dan web server. R
berbasis web mampu berkomunikasi data secara langsung dengan data warehouse
dan R berbasis web juga akan mudah digunakan diberbagai platform sistem operasi.
Variabel penelitian yang akan digunakan pada penelitian ini adalah data
belanja atau konsumsi kebutuhan pokok (beras, jagung) masyarakat pada
Kabupaten Jember, Propinsi Jawa Timur per minggu. Data sensus per tahun di
modelkan dengan rata-rata (averaging), diambil dari data SUSENAS mulai tahun
1997 sampai dengan tahun 2012.
ARIMA ialah model peramalan yang termasuk dalam kelompok peramalan
linier. ARIMA dapat digunakan pada data yang tidak terdapat pola musiman
maupun memiliki pola musiman. Ada beberapa langkah untuk mendapatkan nilai
peramalan menggunakan metode ARIMA yang sesuai dengan metodologi BoxJenkins.
Langkah-langkah tersebut meliputi identifikasi, estimasi parameter, dan
peramalan.
ARIMA Ensemble merupakan model ensemble yang anggotanya terdiri dari
beberapa model ARIMA. Terdapat dua kombiasi pada ensemble yaitu averaging
dan stacking. Pada penelitian ini, dilakukan ensemble averaging pada semua data
dan hasil training. Pada pembahasan model ARIMA terdapat tiga model yang
dijadikan sebagai model didalam ensemble, hasil dari semua data training tersebut,
kemudian akan diambil rata-rata (average).
Pengujian terhadap data testing memperlihatkan bahwa nilai model ARIMA
ensemble pada tahun 2011 adalah sebesar 35781,87. Nilai tersebut mempunyai nilai
yang baik dari model ARIMA yang lain dengan selisih 245,84. Pada tahun 2012,
nilai pada model ensemble adalah sebesar 35370,81 dengan selisih terhadap data
testing sebesar 2515,03. Nilai ini lebih besar dari nilai tahun 2012 pada model
ARIMA(1,0,0) dan ARIMA(1,0,1). Hasil yang diperoleh pada model ARIMA
ensemble pada tahun 2012 menjadi tidak lebih baik dari model ARIMA(1,0,1) dan
ARIMA(1,0,0), karena interval data yang terlalu lebar pada tiga model ARIMA,
yaitu ARIMA(1,0,0), ARIMA(1,0,1) dan ARIMA(1,0,2).
Collections
- MT-Mathematic [100]