Tutorial R : Membangkitkan Data Simulasi Sederhana pada Model Regresi Linier


Analisis Regresi merupakan salah satu jenis metode analisis statistika yang sangat sering digunakan. Hal ini karena analisis regresi memiliki model sederhana yang dapat digunakan untuk menganalisis maupun mengevaluasi bentuk hubungan dan pengaruh suatu variabel. Model yang paling sederhana dari analisis regresi adalah Model Regresi Linier Sederhana. Model ini mengamati hubungan dan pengaruh antara 2 variabel yang disebut variabel respon (dependen, terikat, dll) dan variabel prediktor (independen, bebas, dll). Secara sederhana variabel respon adalah variabel yang dipengaruhi oleh variabel prediktor, sebaliknya variabel prediktor adalah variabel yang memberikan pengaruh atau perubahan terhadap variabel respon dan bersifat fixed variable. Model regresi linier sederhana memiliki bentuk persamaan sebagai berikut:

dengan Y adalah variabel respon, X adalah variabel prediktor, beta0 adalah parameter intercept, beta1 adalah parameter slope terkait X dan e adalah galat/error. Secara umum, model regresi dapat menganalisis hubungan dan pengaruh beberapa/banyak variabel prediktor terhadap variabel respon. Model ini disebut regresi linier berganda (Multiple Regression). Model regresi linier berganda memiliki bentuk persamaan sebagai berikut:

dengan p adalah banyak variabel prediktor yang digunakan dalam model. Model regresi memiliki asumsi bahwa galat menyebar secara normal. Hal ini dapat menjadi salah satu petunjuk penting yang digunakan untuk melakukan pembangkitan data simulasi model regresi.

Simulasi model regresi dapat memberikan cara pandang baru bagaimana pengguna dapat membangkitkan suatu data, menentukan parameter, serta melakukan analisis guna menduga parameter yang telah ditentukan. Jika parameter dugaan mendekati parameter yang ditentukan, maka model analisis tersebut disimpulkan dapat mengevaluasi fenomena yang terjadi. Beberapa tahapan yang dilakukan untuk membangkitkan data simulasi model regresi linier adalah sebagai berikut:


1. Rancangan Pembangkitan Data

Sebagai ilustrasi akan dibangkitkan suatu dataset yang menceritakan informasi mengenai nilai penjualan suatu minimarket yang tersebar di seluruh Indonesia. Sampel yang diambil adalah sebanyak 50 cabang minimarket di seluruh indonesia. Variabel yang akan dibangkitkan antara lain adalah:

  • Y (Nilai penjualan dalam satuan juta)
  • X1 (Biaya promosi dalam satuan juta)
  • X2 (Jumlah karyawan pada setiap cabang)
  • X3 (Lokasi minimarket, 1 untuk daerah kota dan 0 untuk selain kota)
  • e (Galat pada model)

2. Membangkitkan Galat

Simulasi model regresi dapat dilakukan dengan tahap pertama kali yaitu membangkitkan angka acak sebanyak 50 sebagai galat berdistribusi normal dengan rataan 0 dan variansi 1 menggunakan perintah berikut:

set.seed(1)
#membangkitkan 50 angka acak normal rataan 0, variansi 1
galat = rnorm(50,0,1) 

 

3. Membangkitkan Variabel Prediktor

Tahap selanjutnya adalah membangkitkan variabel prediktor atau fixed variable. Jika ingin disusun simulasi model regresi berganda 3 variabel maka perintah yang digunakan adalah sebagai berikut:

#membangkitkan 50 angka acak uniform rentang 10 sampai 15
x1 = runif(50,10,15)
#membangkitkan 50 angka acak cacah (poisson) dengan rataan 5
x2 = rpois(50,5)
#membangkitkan angka acak 0 dan 1
x3 = sample(c(0,1),size=50,replace=TRUE)

 

4. Menentukan Nilai Beta0, Beta1, Beta2, Beta3

Selanjutnya adalah menentukan koefisien untuk Beta0, Beta1, Beta2 dan Beta3 dengan perintah sebagai berikut:

#menentukan nilai koefisien beta
b0 = 25
b1 = 2.25
b2 = 1.15
b3 = 0.95

 

5. Menentukan Variabel Respons

Variabel Respons dapat ditentukan dengan menggunakan perintah sebagai berikut:

y = b0 + (b1*x1) + (b2*x2) + (b3*x3) + galat

 

6. Menyusun Data

Setelah seluruh variabel dan koefisien ditentukan, selanjutnya adalah melakukan penyusunan dataset yang telah ditentukan dengan perintah sebagai berikut:

datasim = data.frame(y,x1,x2,x3)
View(datasim)

Hasil dari pembangkitan dataset tersebut adalah sebagai berikut:


Komponen galat tidak perlu dimasukan dalam data frame. Hal ini karena pada data riil di lapangan, komponen galat merupakan komponen yang tidak diketahui dalam data.

7. Melakukan Analisis Regresi

Setelah data hasil bangkitan siap yang "diceritakan" bahwa data tersebut adalah data informasi nilai penjualan (y), biaya promosi (x1), jumlah karyawan (x2), dan lokasi cabang (x3). Berdasarkan data tersebut, akan dianalisis bagaiaman pengaruh x1, x2, dan x3 terhadap y. Perintah yang dapat digunakan adalah sebagai berikut:

fit = lm(y ~ x1 + x2 +x3, data=datasim)
summary(fit)

Hasil yang diperoleh dari analisis regresi adalah sebagai berikut:

Berdasarkan hasil yang diperoleh, seluruh variabel menunjukan hasil yang signifikan (terlihat dari nilai p-value pada Pr(>|t|)). Jika ditinjau dari hasil dugaan parameter yaitu:

Dugaan beta0 = 22.9559      ~      b0 = 25 
Dugaan beta1 = 2.42274      ~      b1 = 2.25
Dugaan beta2 = 1.15561      ~      b2 = 1.15
Dugaan beta3 = 0.86858      ~      b3 = 0.95

Hasil tersebut telah mendekati koefisien parameter asli/awal yang ditentukan.

0 Response to "Tutorial R : Membangkitkan Data Simulasi Sederhana pada Model Regresi Linier"

Post a Comment