dengan p adalah banyak variabel prediktor yang digunakan dalam model. Model regresi memiliki asumsi bahwa galat menyebar secara normal. Hal ini dapat menjadi salah satu petunjuk penting yang digunakan untuk melakukan pembangkitan data simulasi model regresi.
Simulasi model regresi dapat memberikan cara pandang
baru bagaimana pengguna dapat membangkitkan suatu data, menentukan parameter,
serta melakukan analisis guna menduga parameter yang telah ditentukan. Jika
parameter dugaan mendekati parameter yang ditentukan, maka model analisis
tersebut disimpulkan dapat mengevaluasi fenomena yang terjadi. Beberapa tahapan yang dilakukan untuk membangkitkan data simulasi model regresi linier adalah sebagai berikut:
1. Rancangan Pembangkitan Data
Sebagai ilustrasi akan dibangkitkan suatu dataset yang menceritakan informasi mengenai nilai penjualan suatu minimarket yang tersebar di seluruh Indonesia. Sampel yang diambil adalah sebanyak 50 cabang minimarket di seluruh indonesia. Variabel yang akan dibangkitkan antara lain adalah:
- Y (Nilai penjualan dalam satuan juta)
- X1 (Biaya promosi dalam satuan juta)
- X2 (Jumlah karyawan pada setiap cabang)
- X3 (Lokasi minimarket, 1 untuk daerah kota dan 0 untuk selain kota)
- e (Galat pada model)
2. Membangkitkan Galat
Simulasi model regresi dapat dilakukan dengan tahap pertama
kali yaitu membangkitkan angka acak sebanyak 50 sebagai galat berdistribusi normal dengan rataan 0 dan variansi 1 menggunakan perintah berikut:
set.seed(1)#membangkitkan 50 angka acak normal rataan 0, variansi 1
galat = rnorm(50,0,1)
3. Membangkitkan Variabel Prediktor
Tahap selanjutnya adalah membangkitkan variabel prediktor
atau fixed variable. Jika ingin disusun simulasi model regresi berganda 3
variabel maka perintah yang digunakan adalah sebagai berikut:
#membangkitkan 50 angka acak uniform rentang 10 sampai 15x1 = runif(50,10,15)#membangkitkan 50 angka acak cacah (poisson) dengan rataan 5x2 = rpois(50,5)#membangkitkan angka acak 0 dan 1x3 = sample(c(0,1),size=50,replace=TRUE)
4. Menentukan Nilai Beta0, Beta1, Beta2, Beta3
Selanjutnya adalah menentukan koefisien untuk Beta0, Beta1, Beta2 dan Beta3 dengan perintah sebagai berikut:
#menentukan nilai koefisien betab0 = 25b1 = 2.25b2 = 1.15b3 = 0.95
5. Menentukan Variabel Respons
Variabel Respons dapat ditentukan dengan menggunakan perintah sebagai berikut:
y = b0 + (b1*x1) + (b2*x2) + (b3*x3) + galat
6. Menyusun Data
Setelah seluruh variabel dan koefisien ditentukan, selanjutnya adalah melakukan penyusunan dataset yang telah ditentukan dengan perintah sebagai berikut:
datasim = data.frame(y,x1,x2,x3)View(datasim)
Hasil dari pembangkitan dataset tersebut adalah sebagai berikut:
7. Melakukan Analisis Regresi
Setelah data hasil bangkitan siap yang "diceritakan" bahwa data tersebut adalah data informasi nilai penjualan (y), biaya promosi (x1), jumlah karyawan (x2), dan lokasi cabang (x3). Berdasarkan data tersebut, akan dianalisis bagaiaman pengaruh x1, x2, dan x3 terhadap y. Perintah yang dapat digunakan adalah sebagai berikut:
fit = lm(y ~ x1 + x2 +x3, data=datasim)
summary(fit)
Hasil yang diperoleh dari analisis regresi adalah sebagai berikut:
Berdasarkan hasil yang diperoleh, seluruh variabel menunjukan hasil yang signifikan (terlihat dari nilai p-value pada Pr(>|t|)). Jika ditinjau dari hasil dugaan parameter yaitu:
Dugaan beta2 = 1.15561 ~ b2 = 1.15
Dugaan beta3 = 0.86858 ~ b3 = 0.95
Hasil tersebut telah mendekati koefisien parameter asli/awal yang ditentukan.
0 Response to "Tutorial R : Membangkitkan Data Simulasi Sederhana pada Model Regresi Linier"
Post a Comment