INFERENSI BAYESIAN PADA REGRESI LINIER SEDERHANA
Abstract
Regresi linier sederhana merupakan metode statistika yang digunakan untuk
membentuk model hubungan antara variabel terikat dengan satu atau lebih variabel
bebas, dengan satu variabel bebas. Regresi linier sederhana dapat dianalisis
menggunakan metode bayesian sebagai estimator parameter dengan perhitungan
menggunakan program statistika R. Parameter yang diestimasi pada regresi linier
sederhana yaitu
α dan
β
menggunakan metode kuadrat terkecil. Permasalahan
yang dibahas dalam penelitian ini adalah bagaimana penggunaan inferensi bayesian
0
pada regresi linier sederhana dan penggunaan program R pada inferensi bayesian
tersebut. Tujuan penelitian ini yaitu untuk mengetahui penggunaan inferensi bayesian
pada regresi linier sederhana dan penggunaan program R pada inferensi bayesian
tersebut.
Penelitian ini menggunakan data simulasi dan data riil. Data simulasi yang
digunakan akan dibangkitkan melalui program R dengan ukuran data 30, 100, 1000
dan parameter
α dan
β
yang sudah diketahui. Sedangkan data riil yang digunakan
dalam penelititan ini adalah data perusahaan listrik di PT. PLN (Persero) Distribusi
0
Jawa Timur Area Pelayanan dan Jaringan Jember pada bulan Januari 2000 sampai
dengan Desember 2005. Metode analisis data yang digunakan dalam penelitian ini
adalah metode inferensi bayesian terhadap model regresi linier sederhana, yaitu:
Membangkitkan variabel x dan y dengan parameter yang sudah ditentukan (untuk
data simulasi), menentukan variabel x dan y untuk data rill, mencari varians jika
tidak diketahui, mencari mean dan standard deviasi dari posterior, menentukan
interval kepercayaan dari bayesian, dan menguji slope dari probabilitas dari posterior.
vii
Data simulasi yang digunakan adalah data berukuran 30 (n = 30) dengan ε
~
N(0, (2)
2
), dengan parameter tetap yaitu
α = 6 dan
β
= 3 dan parameter berdistribusi
normal
ε
i
α ~ N(6; (0,3)
0
~ N(0, (5)
2
2
) , dan
β
~ N(3; (0,5)
), parameter tetap yaitu
viii
0
0
2
); data berukuran 100 (n = 100) dengan
α = 12, dan
β
= 5 dan parameter berdistribusi
normal
α ~ N(12; (0,3)
0
2
) , dan
β
~ N(5; (0,5)
2
); data berukuran 1000 (n = 1000)
dengan ε
i
~ N(0, (8)
2
), dengan parameter tetap yaitu
α = 40, dan
β
= 10 dan
parameter berdistribusi normal
α
~ N(40, 1
0
2
0
), dan
β
~ N(10; (0,7)
). Hasil yang
diperoleh dari tiga macam ukuran data simulasi dengan parameter yang ditentukan
menunjukkan bahwa penggunaan inferensi bayesian dipengaruhi oleh pemilihan
prior. Pemilihan prior dapat dipilih dari parameter model jika pada proses simulasi
model atau hasil dari metode kuadrat terkecil, sehingga penggunaan inferensi
bayesian pada data riil dapat menggunakan hasil dari metode kuadrat terkecil. Hasil
dari simulasi diatas dapat menunjukkan bahwa pemilihan prior tepat atau kurang tepat
dari bentuk kurva normal yang dihasilkan.
Proses pengolahan data riil sama dengan data simulasi. Data riil yang diolah
menggunakan metode kuadrat terkecil, diperoleh koefisien dari intercept (
α ) dan
koefisien Jumlah Pelanggan (β) menunjukkan bahwa kedua koefisien tersebut
signifikan. Data yang diolah menggunakan inferensi bayesian didapatkan hasil
dengan input prior normal yang dipilih dapat menggunakan hasil dari metode kuadrat
terkecil. Uji paremeter yang dilakukan menggunakan uji dua arah dan diperoleh
interval kepercayaan dari pengolahan data yang menyimpulkan bahwa jumlah
pelanggan PLN (X) mempengaruhi kWh jual (Y).