Cara Pengecekan Asumsi REGRESI SEDERHANA

Untuk megecek asumsi regresi linier ada 2, yaitu normalitas dan linearitas. Berikut penjabaran dari kedua asumsi tersebut (Graybill dan Iyer, 1994):

A. Linearitas



     Bentuk model yang diduga berhubungan dengan variabel respon terhadap variabel prediktor dapat ditentukan diawal oleh para ahli di bidang studi berdasarkan pengetahuan mereka atau penilaian obyektif dan / atau subjektif mereka. Model hipotesis kemudian dapat dikonfirmasi atau dibantah oleh hasil analisis dari data yang dikumpulkan. Perlu dicatat bahwa model dapat ditentukan bentuknya, tetapi masih dapat bergantung pada parameter yang tidak diketahui. Fungsi pada persamaan (1.1) dapat diklasifikasikan dalam dua macam: linear dan nonlinear.

Linier yang dimaksud adalah parameter regresi. Pengecekan terhadap asumsi linier diperlukan untuk menentukan model yang akan digunakan, meskipun hampir semua model yang tidak linier dapat dijadikan linier melalui transformasi. 
Contoh fungsi linier:
Contoh nonlinier:

Perlu dicatat bahwa aturan linier (nonlinier) tidak menggambarkan hubungan antara X dan Y, namun parameter regresi yang linier atau nonlinier. Ketika X merupakan model tetap, biasanya model yang digunakan adalah model linear (Searle, 1971; Graybill, 1976; Hocking,1996).

B. Normalitas

     Asumsi normalitas merupakan pengujian terhadap residual atau eror, yaitu
diasumsikan menyebar normal. Asumsi normalitas tidak mudah divalidasi khususnya ketika nilai-nilai peubah prediktor tidak terdapat ulangan. Pengecekan asumsi normalitas dapat dinilai dengan pemeriksaan grafik yang tepat dari residual. Jika analisis menggunakan metode parametrik, maka persyaratan normalitas harus terpenuhi yaitu data berasal dari distribusi yang normal. Jika data tidak berdistribusi normal, atau jumlah sampel sedikit dan jenis data adalah nominal atau ordinal maka metode yang digunakan adalah statistik non parametrik.

C. Menguji Asumsi Linearitas Dan Normalitas


     Berikut ini adalah standar residual yang dapat digunakan untuk melihat asumsi linearitas dan normalitas berdasarkan plot (Chatterjee dan Hadi, 2006):


a. Normal probability plot of the standardized residuals

Plot ini diperoleh dari residual standar yang diurutkan dan disebut normal scores. Normal scores adalah hal yang diharapkan jika kita mengambil contoh berukuran n dari distribusi normal standar. Jika residual berdistribusi normal. Residual yang diurutkan seharusnya hampir sama dengan nilai normal. Di bawad asumsi normalitas, plot ini seharusnya menyerupai (hampir) garis lurus dengan intercept nol dan slope satu (rata-rata dan simpangan baku dari standardized residuals).

b. Scatter plots of the standardized residual against each of the predictor variable


Di bawah asumsi ini, standar residual tidak berkorelasi dengan setiap peubah prediktor. Jika asumsi ini terpenuhi maka plot akan memiliki titik-titik yang acak. Jika ada pola yang terbentuk maka mengindikasikan pelanggaran beberapa asumsi. Jika asumsi linearitas tidak terpenuhi maka Y dan/atau beberapa peubah prediktor dapat ditransformasi.

c. Scatter plot of the standardized residual versus the fitted values 


Di bawah standar asumsi, standar residual juga tidak berkorelasi dengan fitted values; karena itu, plot ini juga seharusnya memiliki titik-titik yang acak. Pada regresi sederhana, plot residual standar dengan X dan fitted values akan identik.

d. Index plot of the standardized residuals 


Pada diagnostik plot ini yang akan ditampilkan adalah residual standar versus jumlah observasi. Jika urutan pengambilan pengamatan tidak penting, maka plot ini tidak diperlukan. Jika urutan diperhatikan maka plot ini perlu dilakukan untuk menguji asumsi kebebasan pada eror. Dalam asumsi kebebasan eror, titik-titik harus menyebar acak dalam batas horizontal di sekitar nol.

Keterangan: gambar Scatter plot of residuals versus X mengilustrasikan pelanggaran asumsi:
(a) pola mengindikasikan non-linieritas; dan (b) pola mengindikasikan heterogenitas.

D. Simulasi Contoh

Data pada contoh ini menggambarkan hasil dari percobaan yang dilakukan kepada siswa SD. Percobaan yang dilakukan yaitu memberikan sampel 80 suku kata. Setelah lima menit, siswa diminta mengingat suku kata lagi dan hal tersebut diulang dengan delapan kali interval waktu yang berbeda. Peubah Y adalah jumlah suku kata yang tidak dapat diingat dan X adalah selang waktu yang dicobakan.

1) Contoh data yang terdapat pada buku Eye dan Schuster (1998).




2) Plot untuk melihat linieritas:

Keterangan gambar  Plot standardized residual dan respon

Dari gambar tersebut memiliki titik-titik yang acak, namun terdapat satu data yang berada jauh dari garis nol. Data tersebut dapat menjadi amatan berpengaruh atau pencilan. Maka perlu dilakukan perlakuan khusus terhadap data pada observasi ke-empat tersebut.

Berikut ini adalah pengujian normalitas menggunakan plot:

Keterangan gambar normal probability plot

Dari plot tersebut terlihat secara visual bahwa terdapat data yang mempengaruhi pengujian kenormalan terhadap residual tersebut. Sehingga perlu diuji dengan pengujian hipotesis sebagai berikut:

Ho : Data berdistribusi normal.
Ha : Data tidak berdistribusi normal.

Data X dan Y masing-masing diuji dengan Kolmogorov-Smirnov sebagai berikut:

Keterangan gambar uji Kolmogorov-Smornov

Pada pengujian tersebut, p-value untuk Y sebesar 0,15 dan untuk X sebesar 0,15. Artinya bahwa baik pada Y maupun X gagal menolak Ho sehingga dapat disimpulkan bahwa data bersidtribusi normal. Hasil analisis regresi pada data tersebut sebagai berikut:


dengan nilai R-square 76,7% artinya model tersebut dapat menjelaskan 76,7 % keragaman data dan sisanya dipengaruhi oleh faktor lain.

(Terimakasih teman - teman yang sudah membantu: SELVI ANNISA, RITA MUSTIKA SARI, WIRDA ANDANI, HARDIANTI HAFID, HARY MERDEKA, SARANI)

Komentar

Mau Cari Apa?

ANALISIS REGRESI TERAPAN DIAGNOSTIK SISAAN MODEL REGRESI

UJI ASUMSI PADA REGRESI LINIER SEDERHANA