Istilah regresi berasal dari kajian genetika yang diadakan oleh Sir Francis Galton (1892-1911). Sekarang, regresi diterapkan hampir di semua
bidang ilmu, untuk menaksir/meramalkan nilai satu variabel berdasarkan
variabel lain yang nilainya telah diketahui dan kedua variabel tersebut
memiliki hubungan fungsional sebab-akibat satu dengan yang lainnya.
Dalam bidang ekonomi dan bisnis, misalnya : jumlah modal mempengaruhi
jumlah produksi, tingkat suku bunga mempengaruhi jumlah investasi, biaya
iklan mempengaruhi nilai penjualan dan tingkat pendapatan mempengaruhi
besarnya konsumsi.
Keempat contoh di atas, menunjukkan hubungan sebab-akibat antara dua variabel. Dalam bahasa matematisnya modal, tingkat suku bunga, biaya iklan dan tingkat pendapatan disebut Variabel Bebas (variabel yang mempengaruhi), dan umumnya disimbolkan dengan X. Sedangkan jumlah produksi, besarnya investasi, nilai penjualan dan tingkat konsumsi disebut Variabel Terikat variabel yang dipengaruhi), atau variabel yang nilainya ditentukan oleh nilai variabel X, dan umumnya disimbolkan dengan Y. Hubungan fungsional (sebab-akibat) antara variabel bebas (X) dan variabel terikat (Y), dalam bentuk fungsi dinyatakan sebagai Y = f (X). Artinya, nilai variabel Y tergantung dari atau dipengaruhi oleh nilai variabel X.
Sifat hubungan antara variabel bebas (X) dengan variabel terikat (Y) dapat positif, negatif atau tidak ada hubungan. Hubungan positif sering disebut dengan “hubungan searah” artinya, bila nilai X naik maka nilai Y juga naik atau sebaliknya. Hubungan negatif sering disebut dengan “hubungan berlawanan arah” artinya, bila nilai X naik maka nilai Y akan turun atau sebaliknya.
Tidak ada hubungan artinya, bilai nilai X berubah (naik/turun) maka nilai Y tidak berubah (tetap). Pengaruh antara biaya iklan dengan hasil penjualan, tingkat suku bunga bank dengan deposito, harga suatu barang dengan penawaran.
Keempat contoh di atas, menunjukkan hubungan sebab-akibat antara dua variabel. Dalam bahasa matematisnya modal, tingkat suku bunga, biaya iklan dan tingkat pendapatan disebut Variabel Bebas (variabel yang mempengaruhi), dan umumnya disimbolkan dengan X. Sedangkan jumlah produksi, besarnya investasi, nilai penjualan dan tingkat konsumsi disebut Variabel Terikat variabel yang dipengaruhi), atau variabel yang nilainya ditentukan oleh nilai variabel X, dan umumnya disimbolkan dengan Y. Hubungan fungsional (sebab-akibat) antara variabel bebas (X) dan variabel terikat (Y), dalam bentuk fungsi dinyatakan sebagai Y = f (X). Artinya, nilai variabel Y tergantung dari atau dipengaruhi oleh nilai variabel X.
Sifat hubungan antara variabel bebas (X) dengan variabel terikat (Y) dapat positif, negatif atau tidak ada hubungan. Hubungan positif sering disebut dengan “hubungan searah” artinya, bila nilai X naik maka nilai Y juga naik atau sebaliknya. Hubungan negatif sering disebut dengan “hubungan berlawanan arah” artinya, bila nilai X naik maka nilai Y akan turun atau sebaliknya.
Tidak ada hubungan artinya, bilai nilai X berubah (naik/turun) maka nilai Y tidak berubah (tetap). Pengaruh antara biaya iklan dengan hasil penjualan, tingkat suku bunga bank dengan deposito, harga suatu barang dengan penawaran.
Contoh dua variabel yang memiliki
hubungan positif/searah. Pengaruh antara tingkat suku bunga dengan
investasi, jumlah peserta KB dengan tingkat kelahiran, harga suatu
barang dengan jumlah permintaan.
Contoh
dua variabel yang memiliki hubungan negatif/berlawanan arah. Pengaruh
usia kendaraan dengan tinggi gedung, kecepatan kendaraan dengan jumlah
bayi yang lahir, jumlah jembatan yang dibangun dengan usia seseorang.
Bila ketiga jenis sifat hubungan antara dua variabel tersebut dinyatakan dalam grafik, bentuk grafiknya sebagai berikut:
Pola hubungan antara dua variabel
yaitu X dan Y, yang dibentuk oleh serangkaian pasangan data (Xi, Yi)
dengan i = 1,2,3 ... n, dapat berbentuk berbagai macam persamaan
regresi, mungkin linear atau tan-linear (kuadrat, kubik, eksponensial,
elip dan bentuk lainnya). Sebelum persamaan regresi ditentukan, apakah
bentuknya linear atau tan-linear, sebaiknya dibuat terlebih dahulu
diagram pencarnya (scatter diagram), setelah itu baru dipilih persamaan
regresi yang paling mendekati. Langkah itu diambil agar penyimpangan
yang terjadi sekecil mungkin.
Empat bentuk diagram pencar (scatter diagram):
Tujuan Analisis Regresi:
- Untuk memperoleh suatu persamaan garis yang menunjukkan persamaan hubungan antara dua variabel. Persamaan garis yang diperoleh disebut persamaan regresi.
- Untuk mengetahui besarnya pengaruh perubahan tiap unit variabel bebas terhadap perubahan variabel terikatnya. Pengaruh perubahan tiap unit variabel bebas ditunjukkan oleh nilai koefisien regresinya.
- Untuk menaksir nilai variabel terikat (Y) berdasarkan variabel bebas (X) yang nilainya telah diketahui. Penaksiran disini bersifat deterministik (pasti) atau non-stokastik, maksudnya penaksiran atau pendugaan yang dilakukan mengabaikan faktor ketidakpastian.
Interpretasi Terhadap Nilai Koefisien Regresi:
Tanda positif atau negatif dari nilai
koefisien regresi bukanlah menyatakan tanda aljabar, melainkan
menyatakan arah hubungan atau lebih tegasnya menyatakan pengaruh
variabel bebas X terhadap variabel terikat Y. Nilai b yang positif
menyatakan bahwa variabel bebas X berpengaruh positif terhadap nilai
variabel terikat Y. Sedangkan nilai b yang negatif (b dengan tanda
negatif) menyatakan bahwa variabel bebas X berpengaruh negatif terhadap
nilai variabel terikat Y.
Interpretasi terhadap nilai koefisien regresi (b), adalah sebagai berikut :
b = A (b bertanda positif), artinya
bila nilai variabel bebas X naik/bertambah/meningkat 1 unit, maka nilai
variabel Y akan naik/bertambah/meningkat sebesar A unit. Sebaliknya bila
nilai variabel turun/berkurang 1 unit, maka nilai variabel Y akan
turun/berkurang sebesar A unit.
b
= -A (b bertanda negatif), artinya bila nilai variabel bebas X
naik/bertambah/meningkat 1 unit, maka nilai variabel Y akan
turun/berkurang sebesar A unit. Sebaliknya bila nilai variabel
turun/berkurang 1 unit, maka nilai variabel Y akan
naik/bertambah/meningkat sebesar A unit.
Menaksir Nilai Variabel Terikat Y:
Dari serangkaian data sampel yang
terdiri dari n pasangan data (Xi,Yi), nilai a dan b dihitung, kemudian
persamaan regresi sampel Y = a + bX disusun. Berdasarkan persamaan
regresi tersebut, kita dapat menaksir nilai variabel terikat Y,
berdasarkan nilai variabel bebas (X) tertentu, dalam batas-batas nilai X
data pengamatan dengan mensubstitusikan nilai X tertentu tersebut
kedalam persamaan regresi, Y = a + bX + e.
b. Interpretasi terhadap nilai koefisien regresi b adalah:
Dari persamaan regresi di atas, dapat
diketahui nilai b = 0,42. Nilai b = 0,42, memiliki arti bahwa setiap
kenaikan pendapatan sebesar Rp. 1 juta, maka konsumsi akan meningkat
sebesar Rp. 0,42 juta (=Rp. 420.000). Atau, setiap penurunan pendapatan
sebesar Rp. 1 juta, maka konsumsi berkurang sebesar Rp. 0,42 juta (=Rp.
420.000).
c. Menaksir besarnya konsumsi seorang
karyawan yang memiliki pendapatan Rp. 23 juta. Dari persamaan regresi
yang diperoleh yaitu : Y = 4,25 + 0,42 X, akan dapat ditaksir nilai Y
untuk X = 23, sebagai berikut :
Y = 4,25 + 0,42 Xuntuk X = 23 => Y = 4,25 + 0,42 (23)
= 13,91
Jadi, konsumsi seorang karyawan yang pendapatannya sebesar Rp. 23 juta ditaksir sebesar Rp. 13,91 juta (=Rp. 13.910.000).
Kesalahan Baku dari Dugaan
Koefisien Determinasi
Salah satu alat utama untuk mengukur
ketepatan/kesesuaian (goodness of fit) garis regresi terhadap datanya
adalah koefisien determinasi. Koefisien determinasi adalah suatu ukuran
yang dapat menjelaskan porsi variasi variabel terikat yang dapat
dijelaskan oleh garis regresinya atau variabel bebasnya
Namun, dalam prakteknya, untuk dua
variabel yang memiliki hubungan fungsional, para statisi menterjemahkan
istilah “menjelaskan” dengan mempengaruhi. Dengan demikian untuk
variabel-variabel yang memiliki hubungan fungsional, koefisien
determinasi diartikan sebagai besarnya pengaruh (dalam persen) variabel
bebas terhadap variasi (naik turunnya) variabel terikatnya.
Analisis Korelasi
Analisis korelasi bertujuan untuk
mengetahui keeratan hubungan (kuat-lemahnya) hubungan antara variabel
bebas X dengan variabel terikat Y, tanpa melihat bentuk hubungannya,
apakah linear atau tan linear. Kuat-lemahnya hubungan antara dua
variabel dilihat dari koefisien korelasinya. Jadi, koefisien korelasi
(r) merupakan alat untuk mengukur kuat-lemahnya hubungan antara dua
variabel, sedangkan koefisien determinasi (r2) merupakan alat untuk
mengukur ketepatan garis regresi terhadap sebaran datanya.
Koefisien Korelasi Melalui Analisis Regresi
Analisis korelasi biasanya dilakukan
secara bersamaan dengan analisis regresi. Jika, analisis korelasi
dilakukan bersamaan dengan analisis regresi maka koefisien korelasi
merupakan akar dari koefisien determinasi, yang dapat dihitung sebagai
berikut:
Nilai dari koefisien korelasi (r)
berkisar antara -1 dan +1, yaitu -1 = r = 1. Nilai r positif menunjukkan
hubungan antara variabel X dan Y searah. Nilai r negatif menunjukkan
hubungan antara variabel X dan Y berlawanan arah. Nilai r = 0
menunjukkan antara variabel X dan Y tak ada hubungan secara linear, akan
tetapi mungkin saja terjadi hubungan secara tan-linear.
Korelasi Peringkat
Menurut metode ini, kuat-lemahnya
korelasi/hubungan antara dua variabel diukur berdasarkan perbedaan
urutan kedudukan (ranking) nilai skornya dan bukan berdasarkan nilai
data pengamatan (nilai asli). Jadi, datanya berupa data ordinal atau
data urutan menurut kedudukan. Tehnik korelasi peringkat ini, akan
memberikan hasil yang cukup memuaskan bila ukuran sampelnya, tidak
kurang dari 10 dan tidak lebih dari 29. Jadi, ukuran sampelnya termasuk
kecil dan apabila ukurannya diluar itu, sebaiknya analisis korelasi
peringkat ini tidak digunakan.
Untuk menentukan (mencari) koefisien korelasi, hubungan antara dua variabel, dipakai rumus Spearman sebagai berikut:
Penyelesaian:
Terlebih dahulu masing-masing nilai
data observasi dari masing-masing variabel diberi nomor urut (ranking).
Pemberian nomor urut ini mulai dari data dengan nilai terbesar. Data
dengan nilai terbesar boleh diberi nomor ranking terkecil atau
sebaliknya. Dibawah ini, data dari masing-masing variabel dengan nilai
terbesar diberi ranking mulai nomor terkecil yaitu nomor 1. Andaikata,
pemberian nomor ranking ini dibalik yaitu pengalaman kerja terlama dan
hasil penjualan terbesar diberi ranking dengan nomor urut terbesar yaitu
10, akan memberikan hasil yang sama.
Penyelesaian:
Pemberian ranking, dimulai dari
variabel dengan nilai terbesar diberi ranking 1 dan seterusnya. Pada
variabel laba bersih ada data bernilai kembar/sama, cara menghitungnya
adalah jumlah skor ranking dibagi 2, yaitu (1+2)/2=1,5. Pada variabel
skor nilai ada data bernilai kembar/sama, cara menghitungnya adalah
jumlah skor ranking dibagi 2, yaitu (9+10)/2=9,5. Jika ada 3 data
bernilai kembar/sama, maka rankingnya sama dengan jumlah skor rankingnya
dibagi 3.
Tidak ada komentar:
Posting Komentar