Ali Tutupoho, S.E., M.Si. Dosen EP-FE_UP

Sabtu, 14 Desember 2013

ANALISIS MODEL REGRESI

Pengertian model regresi

Analisa regresi adalah suatu teknik statistik yang menggunakan hubungan antara dua variabel atau lebih untuk mendapatkan garis yang fit sehingga satu variabel dapat diprediksi atau diestimasi berdasarkan variabel lainnya.  Misal, jika seseorang mengetahui hubungan antara biaya iklan dengan penjualan, maka orang tersebut dapat memprediksi hasil penjualan dengan menggunakan analisa regresi jika pengeluaran iklan sudah ditentukan.  Tujuan model regresi ini adalah untuk mendapatkan suatu bentuk hubungan antara variabel yang akan diestimasi (dependent variable) dengan variabel bebas (independent variable) dan menggunakan model tersebut untuk mengestimasi nilai dari variabel yang akan di estimasi.  Misal seorang manajer ingin melihat hubungan antara biaya iklan perusahaannya dengan hasil penjualan perusahaannya, ingin menguji hipotesa bahwa dengan bertambahnya biaya iklan maka hasil penjualannyapun akan bertambah dan lebih jauh ingin memperkirakan/estimasi seberapa kuat hubungannya.
Model regresi mengasumsikan bahwa faktor-faktor yang diramal menunjukkan adanya suatu hubungan sebab akibat (cause-effect relationship) dengan satu atau lebih variabel bebas (independent variable). Model causal lebih digunakan untuk pengambilan keputusan (decision making) dan kebijaksanaan (policy).  Konsep sebuah hubungan antara dua variabel, kita kenal dengan hubungan fungsional dan hubungan statistik.  Sebuah hubungan fungsional antara dua variabel dinyatakan dengan sebuah formula matematika.  Jika X adalah variabel bebas (independent variable) dan Y adalah variabel tidak bebas (dependent variable), sebuah hubungan fungsional dapat ditulis sebagai berikut:
                                                Y = f(X)
untuk nilai X tertentu, fungsi f merupakan nilai dari Y
Contoh:
hubungan antara hasil penjualan (Y) dengan jumlah unit yang terjual (X).  Jika harga penjualan adalah Rp 2.000 per unit, dan hubungan diatas dinyatakan dengan persamaan  Y = 2X       maka hubungan fungsional ini dapat ditunjukan seperti pada tabel dibawah ini

Sebuah hubungan statistik tidak seperti hubungan fungsional, hubungan ini tidaklah sempurna (exact).  Secara umum observasi-observasi untuk sebuah hubungan statistik tidak berada (jatuh) tepat pada garis hubungan.


Pada Gambar.1. terlihat adanya hubungan antara jumlah produksi dengan lamanya jam kerja. Makin besar produksi makin lama jam kerjanya. Namun jika kita perhatikan, hubungan tersebut bukanlah merupakan hubungan yang sempurna. Disana terlihat adanya sebaran, adanya variasi jam kerja pada tiap-tiap jumlah produksi, seperti pada X=30 dan X=80.  Oleh karena adanya sebaran titik-titik pada sebuah hubungan statistik, maka plot tersebut disebut diagram pencar/sebaran (scatter diagram) dalam istilah statistik.  Jika kita buat garis hubungan yang menyatakan hubungan secara statistik antara lamanya jam kerja dengan jumlah produksi seperti terlihat pada Gambar.1, sebagian besar titik-titik tersebut tidak berada tepat pada garis.  Sebaran titik-titik disekitar garis mewakili variasi pada jam kerja yang tidak berhubungan (tidak dipengaruhi) oleh jumlah produksi dan ini cenderung disebabkan karena sifat random (acak) secara alamiah.  Hubungan statistik tetap berguna meskipun tidak adanya hubungan fungsional yang secara tepat (exact).  Sebaran titik-titik sekitar garis hubungan itulah yang merupakan ciri-ciri dari sebuah hubungan statistik. Dari gambar . 2  terlihat bahwa rata-rata dari distribusi probabilita mempunyai hubungan yang sistematik pada level X.  Hubungan sistematik inilah yang dikatakan fungsi regresi dari Y terhadap X.  Garis dari fungsi regresi ini disebut garis regresi. Fungsi regresi diatas adalah linier.  Berdasarkan contoh diatas dapat kita katakan bahwa rata-rata harapan (expected mean) lama jam kerja berubah-ubah secara linier dengan jumlah produksi.
Sebuah model regresi adalah:
-  sebuah distribusi probabilita dari Y untuk setiap level X
-  Rata-rata dari distribusi-distribusi probabilita tersebut  berbeda dalam bentuk yang sistematis dengan X.
Model regresi mungkin saja terdiri dari lebih dari satu variabel bebas, misal dengan dua variabel bebas X1 dan X2.  Hubungan antara rata-rata dari distribusi probabilita ini dengan variabel bebas (X1 dan X2) ditentukan dalam sebuah regresi permukaan (surface) dalam suatu bidang tiga dimensi.
Pada kenyataannya dalam membuat sebuah model, hanya beberapa variabel bebas tertentu yang dapat digunakan pada sebuah model regresi pada situasi tertentu.  Masalah pokok disini adalah pemilihan variabel bebas untuk model regresi sehingga model tersebut dapat digunakan dengan baik untuk kepentingan analisa. Yang perlu diperhatikan dalam pemilihan variabel bebas ini adalah:
            1.         Variabel-variabel yang akan terpilih dalam model harus dapat mengurangi variasi yang tersisa pada variabel tidak bebas Y
            2.         Variabel yang terpilih adalah variabel yang penting dalam proses analisa
3.         Tingkat keakuratan dalam mendapatkan variabel-variabel tersebut.

Korelasi Pearson
Statistik ini merupakan suatu ukuran asosiasi atau hubungan  yang dapat digunakan untuk menyatakan besar hubungan linier antara dua variabel ketika data adalah data kuantitatif (data berskala interval atau rasio) dan kedua variabel adalah bivariat yang berdistribusi normal, sedangkan statistik untuk mengukur hubungan dua variabel yang bersifat kualitatif dengan skala ordinal dapat menggunakan korelasi Spearman (materi ini dibahas pada pertemuan kesembilan. selain untuk melihat besar hubungan antar dua variable kualitatif, korelasi ini juga dapat digunakan untuk menguji aumsi kesamaan varians). Simbol korelasi pada ukuran populasi adalah    ρ  (dibaca: rho) dan pada ukuran sampel adalah r.  Formula untuk korelasi Pearson adalah sebagai berikut:
Besar hubungan linier antara produksi dan jam kerja karyawan pada perusahaan industri tersebut adalah sebesar 0,9978 atau sebesar 99,78 persen. Jika nilai korelasi dikuadratkan akan didapat suatu nilai yang menyatakan besarnya pengaruh variasi suatu variabel terhadap variabel lainnya. Nilai tersebut biasa disebut dengan koefisien determinasi (r2) (coefficient of determination). Koefisien determinasi mempunyai range nilai berkisar antara 0 sampai 1 .  Dalam hal contoh diatas, variasi produksi mempunyai pengaruh sebesar 99,56 persen terhadap variasi jam kerja karyawan pada perusahaan tersebut.
Bentuk model regresi linier sederhana
Model regresi linier dengan satu variabel bebas adalah sebagai berikut:

Model regresi pada persamaan (1) di atas disebut model regresi linier sederhana, Sederhana karena hanya menggunakan satu variabel bebas.  Linier karena linier dalam parameter dan juga dalam variabel bebasnya.  Parameter β0 adalah konstanta (intercept) dari garis regresi.  β0 dapat berarti nilai dari rata-rata distribusi probabilita Y pada X = 0.  Namun jika model tidak mencakup X = 0, β0 tidak mempunyai arti apa-apa secara terpisah dalam model regresi.  Parameter β1 adalah kemiringan (slope) dari garis regresi yang merupakan suatu perubahan dari rata-rata distribusi probabilita Y dengan bertambahnya 1 unit X.    Nilai observasi Y dalam percobaan ke –i adalah jumlah dari 2 komponen :
εi dan εj  diasumsikan tidak berkorelasi, sehingga respon Yi dan Yj  juga tidak berkorelasi.  Asumsi standar adalah bahwa error independen, mempunyai rata-rata nol dan konstan varians σ2 serta mengikuti distribusi normal.  Asumsi terakhir diperlukan untuk membuat uji F dapat digunakan. Jika model yang dipilih benar, maka residual harus menunjukkan kecenderungan mengikuti asumsi atau setidaknya tidak bertentangan dengan asumsi.
Metode kuadrat terkecil secara khusus menggunakan jumlah dari kuadrat deviasi.  Jika kriteria ini dilambangkan dengan Q, maka Q ditulis sebagai berikut:
 menurut metoda kuadrat terkecil, dengan meminimumkan Q maka akan didapat estimator dari β0 dan β1 yaitu b0 dan b1.  Secara matematik untuk mendapatkan nilai minimum dilakukan differensiasi terhadap Q secara parsial terhadap β0 dan β1 kemudian disamakan dengan nol.
Apapun bentuk fungsional dari distribusi εi  ( begitu juga Yi) metode kuadrat terkecil (Least Square Method) memberikan estimator b0 dan b1  yang tidak bias (unbiased) dan mempunyai varians minimum diantara semua unbiased linear estimator (teorema Gauss-Marcov). Untuk membuat interval dari estimates dan melakukan uji, perlu dibuat suatu asumsi tentang bentuk fungsional dari distribusi εi .  Asumsi standar adalah error berdistribusi normal. Sedikit penyimpangan dari kenormalan tidaklah menyebabkan masalah yang serius. Namun penyimpangan yang jauh dari kenormalan haruslah diperhatikan. Kenormalan dari random error dapat dipelajari dengan melihat beberapa grafik dari residu. Box plot sangat membantu untuk mendapatkan informasi tentang kesimetrisan dari residu dan kemungkinan adanya pencilan (outliers).  Selain box plot, kita juga dapat membuat histogram, diagram pencar, atau plot batang daun dari residu untuk melihat penyimpangan dari kenormalan secara umum.  Namun untuk itu diperlukan jumlah sampel yang cukup besar untuk studi regresi agar dapat memberikan informasi yang baik tentang bentuk distribusi dari random error.  Cara lain untuk melihat kenormalan adalah dengan uji Lilliefors atau dengan uji kecocokan/kesesuaian (goodness of fit test).  Jika asumsi tidak terlanggar dapat dikatakan bahwa dasar data yang digunakan sudah benar.

Sumber
Dapat dilihat disini
atau di My Blogger


Dosen Pengajar Mata Kuliah Statistik Ekonomi 1
ttd

Jumat, 13 Desember 2013

Buku Ilmu Ekonomi & Bisnis Keuangan

Index of /images/products/buku/bisnis--keuangan/ekonomi/ilmu-ekonomi



Sumber:
Dapat diklik disini


Dosen Pengajar Mata Kuliah Statistik Ekonomi 1
ttd

Kamis, 12 Desember 2013

MATERI VALIDITAS & RELIABILITAS

UJI VALIDITAS DAN REALIBILITAS ITEM PERTANYAAN PENELITIAN DILENGKAPI CONTOH PENGERJAAN DENGAN SPSS 16

Selamat siang sobat semua.. Piye kabare? Hehehe.. Moga tetap sehat dan sukses selalu ya.. Amiiin..
Oke deh, kali ini saya mau posting lagi nih sob hemm khusus bagi sobat yang mau ngadain penelitian tapi pakai data primer.. Nah, otomatis sobat harus buat daftar pertanyaannya alias kuesionernya dulu dong hehehe..
Nah, pertanyaan yang bakal sobat pakai buat penelitian tuh kudu diuji dulu validitas dan realibilitasnya.. Pertama, apa sih maksudnya valid dan reliable? Nah, valid itu adalah jika item-item pertanyaan yang sobat buat cocok, pas/tepat sesuai dengan tujuan penelitian sobat.  Apa yang ingin sobat ukur sudah bisa secara cermat diperoleh dengan menggunakan item-item pertanyaan sobat.
Nah, karena alasan itulah kita butuh menguji kevalidan item-item pertanyaan secara statistik yakni dengan mengkorelasikan masing-masing skor item pertanyaan (masing-masing variabel) dengan skor total (penjumlahan dari seluruh item pertanyaan 1 sampai terakhir). Uji yang kita pakai adalah bivariate korelasi pearson (tanpa koreksi) dan dengan koreksi (corrected item total correlation). 

Biasanya kalau item pertanyaan yang sobat pakai lumayan banyak, pakai yang tanpa koreksi saja sementara jika hanya sedikit (katakanlah 10 pertanyaan) pakai yang terkoreksi untuk menyurutkan pengaruh over estimate (estimasi yang lebih tinggi dari yang sebenarnya).

Selanjutnya adalah reliabilitas. Jadi begini, item kuesioner/pertanyaan  yang reliabel harus bersifat konsisten. Artinya kapanpun di waktu lain kita bahkan orang lain melakukan penelitian yang hampir sama dengan penelitian saat ini, pertanyaan yang kita pakai dalam meneliti masih handal dan bisa dipergunakan dengan memberikan hasil yang sama atau mendekati sama.

Nah, andaikata kita punya 10 pertanyaan, kita harus uji masing-masing pertanyaan ini lalu setelah kita uji validitas ternyata hanya ada 8 pertanyaan yang valid, maka hanya 8 pertanyaan inilah yang kita masukkan lagi ke dalam uji realibiltasnya. Oke tanpa berlama-lama, saya langsung berikan contohnya. Silahkan sobat download disini.

Pertanyaan yang dipakai disini terkait dengan konteks melihat motivasi. Saya buat demikian karena ada maksudnya untuk uji selanjutnya sob hehehe.. Yaudah ntar aja itu dipikirin hehehe,, Sekarang, silahkan masukin aja datanya dulu ke dalam SPSS, dan ubah saja nama variabel menjadi item1... item10 atau terserah sobat deh.. hehe.. 

Sobat lihat ada kolom item total. Nah, kolom ini merupakan penjumlahan dari total item pada masing-masing responden. Ingat, baris menunjukkan responden sedangkan kolom menunjukkan item pertanyaan. Jadi, kita menggunakan 10 item pertanyaan dengan 12 orang responden. Berikut tampilannya:




Selanjutnya kita melakukan uji korelasi bivariat Pearson dengan mengklik Analyze, Correlate, Bivariate. Lalu masukkan seluruh variabel ke dalam bagian Variables dan pada bagian Correlation Coeficient centang Pearson (default SPSS) uji 2 arah (two tailed). Lalu klik OK. Ilustrasinya seperti ini: 
 
Maka sobat akan mendapatkan output pengujian seperti ini nih..
Perhatikan masing-masing nilai korelasi item pertanyaan dengan item total. Oleh karena kita menggunakan sampel 12 responden maka derajat kebebasan (degress of freedom) adalah n-2=10. Sekarang cari nilai tabel r dengan derajat bebas (df)=10 pada Alpha 0,05 diperoleh 0,5760. Inilah batasan (cut off) nilai yang kita pakai. Nilai korelasi harus lebih besar dari 0,5760. Nah, dari output ternyata item pertanyaan 1,9 dan 10 tidak valid dipakai dalam penelitian. Masing-masing nilainya lebih kecil dari 0,5760 yaitu 0,428; 0,283 dan 0,014 (tidak usah perhatikan arah, hanya nilainya).


Berarti kita hanya menggunakan tujuh pertanyaan dalam penelitian (yang valid).
Namun terkadang peneliti masih belum puas jika hanya menggunakan korelasi bivariat yang belum dipersenjatai koreksi terhadap hasil yang overestimate kendati pertanyaan yang mereka pakai sudah lumayan banyak (>20 pertanyaan). Jadi, mereka lakukan lagi uji terkoreksi (corrected item correlation). 

Seperti yang saya sampaikan di atas, kalau item pertanyaan sedikit perlu juga uji terkoreksi ini karena untuk jumlah item yang sedikit, nilai over estimate akan berpengaruh terhadap hasil penelitian.. Hemmmh, jadi ayo deh kita lakukan uji validitas terkoreksinya hehehe..

Langkahnya, pada SPSS silahkan pilih Analyze, Scale, Reliability Analysis. Masukkan item1 sampai 10 (Ingat, untuk itemtotal tidak perlu yaa hehehe). Berikut gambarannya:
  


Lalu jangan lupa klik dulu Statistics dan pada bagian Descriptive For silahkan centang pilihan Scale If Item Deleted. Ini gambarannya:
 
Ini dia output yang dihasilkan:

Perhatikan saja nilai Corrected-nya dan masih sama dengan cut off value, kita pakai 0,5760. Ternyata tidak hanya item 1,9 dan 10 saja yang nilainya lebih kecil daripada 0,5760 tetapi juga item 5 dan 8. Karena itu, kita membuang pertanyaan nomor 1,5,8,9,dan 10 dan untuk penelitian, kita hanya memakai 5 pertanyaan yang valid saja yaitu item no 2,3,4,6, dan 7. Berikutnya, kelima pertanyaan yang valid ini yang akan kita uji realibilitasnya ya sobaaat hehehe.. 
Jadi sedikit saran saja, usahakan sobat buat item pertanyaan yang cukup banyak ya agar pada saat uji validitas seenggaknya masih banyak pertanyaan valid yang bisa dipakai dalam penelitian hehe..
Untuk uji realibilitas tenang saja akan segera saya posting contohnya.. Yang pentingkan sobat dah dapat dulu konsepnya bagaimana toh hehehe.. Oiya kalau mau download tabel r disini ya..
Oke deeeh sob.. kurang lebihnya, mohon dimaafin ya.. Semoga postingan ini bermanfaat.. Semangat dan sukses buat kita semua :-)

Dosen Pengajar Mata Kuliah Statistik Ekonomi 1
ttd

BUKU REFERENSI















Dosen Pengajar Mata Kuliah Statistik Ekonomi 1
ttd

SOAL UTS & UAS STATISTIK EKONOMI

SOAL UTS & UAS STATISTIKA

SOAL UTS & UAS STATISTIKA EKONOMI 1
SOAL Ujian Tengah Semester Statistika Ekonomi 1 :
Berikut adalah data jumlah pengunjung yang berbelanja di Matahari dalam periode 2 minggu terakhir :
55
56
62
62
63
63
63
64
64
64
64
64
65
65
67
67
67
67
68
69
70
70
70
71
73
73
73
74
74
75
75
75
75
76
76
76
77
77
77
77
77
77
77
78
78
78
78
79
79
80
80
80
80
80
81
81
81
82
83
84
84
86
87
87
87
88
88
89
90
90
90
91
92
95
95
96
97
97
98
99
Diminta :
a.       Sederhanakan data tersebut dalam tabel Distribusi Frekuensi !
b.      Susunlah tabel Distribusi Frekuensi Relatif u/ data tersebut !
c.       Buatlah tabel Frekuensi Kumulatif “Kurang Dari” & “Lebih Dari” !
d.      Buatlah sajian grafiknya dalam bentuk histogram & poligon !
SOAL UJIAN AKHIR SEMESTER STATISTIKA EKONOMI 1
1.     Hitunglah nilai Mean, Median & Modus dari Distribusi Frekuensi berikut :
Kelas Interval
Frekuensi
31 – 40
3
41 – 50
4
51 – 60
7
61 – 70
17
71 – 80
22
81 – 90
27
91 – 100
7
2. Berikut adalah data hasil penelitian dari 12 perusahaan yang dilakukan untuk mengetahui hubungan antara promosi dengan penjualan :
No
Perusahaan
X
Y
1
A
6
45
2
B
7
47
3
C
7
45
4
D
6
47
5
E
7
47
6
F
6
45
7
G
8
47
8
H
7
47
9
I
8
48
10
J
9
48
11
K
7
47
12
L
8
48
Tentukan besarnya koefisien korelasinya !
3.     Sebuah penelitian dilakukan u/ mengetahui hubungan antara pengeluaran (Y) dengan pendapatan (X), sehingga diambil sampel sebanyak 10 keluarga dengan hasil sebagai berikut :
Pengeluaran (Y)
7
8
10
11
12
14
14
16
17
22
Pendapatan (X)
8
10
12
14
15
19
22
24
26
30
  
Berdasarkan data tersebut :
a.     Buatlah persamaan regresinya !
b.    Berikan interpretasi terhadap nilai b yang diperoleh !
c.     Dugalah rata-rata pengeluaran apabila pendapatan seorang keluarga adalah 20 !
4.     Apa yang anda ketahui tentang :
a.     Kuartil
b.    Desil
c.     Persentil
d.    Analisis Regresi Berganda
SELAMAT BELAJAR (^_^)


Dosen Pengajar Mata Kuliah Statistik Ekonomi 1
ttd