Rabu, 22 Juni 2016

Regresi Berganda (Statistika Bisnis)



Model regresi linier berganda merupakan perluasan dari model regresi linier sederhana, dimana faktor utama yang membedakan model ini dengan model linier sederhana adalah pada model ini terdapat lebih dari satu variabel independen. Sehingga variabel dependen (Y) dipengaruhi oleh dua atau lebih variable independen (X1, X2, X3, . . . Xn)

A.      THE MULTIPLE REGRESSION MODEL

Secara umum, model regresi linier berganda dapat dinyatakan dalam persamaan sebagai berikut :

 

Dimana :
·         Model  , merupakan komponen deterministic yang merupakan model regresi dari populasi untuk nilai spesifik dari (X1, X2, X3, . . . Xn)
·          adalah kesalahan acak (random error) yang mempresentasikan variasi yang tidak dapat diduga diantara nilai-nilai Y untuk sekelompok nilai spesifik dari (X1, X2, X3, . .  Xn)
·         Kesalahan acak (random error) diukur dengan variansi error (), yang diprediksiberdasarkan sampel yang mengukur ketepatan dari model. Dimana, semakin kecil nilai estimasi dari variansi error , maka model regresi linier berganda yang akan diestimasi juga semakin baik.
·          adalah perpotongan (intercept) garis terhadap sumbu Y
·          adalah kemiringan (slope) garis yang menggambarkan perubahan bersih Y per unit perubahan X1
·          adalah kemiringan (slope) garis yang menggambarkan perubahan bersih Y per unit perubahan Xn

Dalam mengestimasi parameter dari  dan , , . . ., digunakan metode kuadrat terkecil (ordinary least square). Metode kuadrat terkecil digunakan untuk menentukan suatu persamaan regresi dengan meminumkan jumlah kuadrat jarak vertical antara nilai sebenarnya dari Y dan nilai prediksi dari Y. Estimator  dan  diberi symbol bo dan b1, b2, b3, … bn sehingga persamaan estimasi menjadi :

Persamaan Regresi (metode kuadrat terkecil)
 

Jika  , maka untuk menentukan persamaan regresi dengan parameter b1 dan b2, dapat digunakan persamaan berikut :




Contoh
Dibawah ini disajikan data mengenai pengaruh taksuran nilai tanah (X1) dan taksiran nilai perbaikan (X2) harga jual rumah (Y)

Harga Jual Tanah
Taksiran Nilai Tanah
Taksiran nilai perbaikan
28
14
2
66
35
5
38
22
4
70
29
4
22
6
3
27
15
3
28
17
3
47
20
4
14
12
2
68
29
5

Buatlah model persamaan regresi berganda untuk data diatas!






Jawab mengunakan excel



 
6

Persamaan regresi linier berganda dari output excel tersebut adalah :

 = -11.452 + 1.467X1 + 6.588X2

B.     Uji Signifikansi Model Regresi

Menguji Model Keseluruhan
Dalam regresi sederhana, uji t dari pengurangan garis kemiringan digunakan untuk menetapkan apakah kemiringan populasi dari garis kemiringan berbeda dari nol, yaitu apakah variabel independen berkontribusi signifikan secara linear dalam memprediksi variabel dependen.
Hipotesis untuk pengujian ini adalah:
H0: = 0
Ha:   0
Dalam regresi berganda, uji analog digunakan dengan statistik F. Signifikan keseluruhan dari model regresi berganda diuji dengan hipotesis sebagai berikut:
H0:
Ha: Setidaknya terdapat satu pengurangan koefisien  0
Jika kita gagal untuk mengolah null hypothesis, artinya  model regresi tidak memiliki prediktabilitas yang signifikan pada variabel dependen. Penolakan hipotesis nol mengidentifikasikan bahwa ada setidaknya satu variabel independen yang menambah prediktabilitas secara signifikan pada y.
Nilai F dapat dihitung dengan menggunakan rumus berikut.
F =
Dimana:
            MS = mean square
            SS  = sum of squares
            df   = degree of freedom
            k     = jumlah variabel independen
            N    = jumlah observasi
Jika model regresi hanya memiliki satu variabel independen yang linear, berarti itu adalah model regresi sederhana. Maka, uji F untuk keseluruhan model adalah sama dengan uji t untuk kemiringan populasi signifikan. Nilai F yang diperlihatkan dalam tabel regresi ANOVA berhubungan pada uji t untuk kemiringan dalam regresi sederhana.
F = t2
Dalam regresi sederhana, nilai F dan nilai t memberikan informasi yang percuma tentang keseluruhan uji model.
Kebanyakan peneliti yang menggunakan analisis regresi berganda akan meneliti nilai F dan nilai p pada awal proses. Jika F tidak signifikan, maka tidak ada koefisien regresi populasi yang signifikan berbeda dari nol, dan model pengurangan tidak memiliki prediktabilitas pada variabel dependen.
Uji Signifikan pada Koefisien Regresi
Dalam regresi berganda, uji signifikan individual dapat dihitung pada tiap koefisien regresi dengan menggunakan uji t. Tiap uji t adalah analog kepada uji t pada kemiringan untuk analisis regresi sederhana. Hipotesis untuk menguji koefisien regresi tiap variabel independen adalah:
H0: = 0
Ha:   0
H0: = 0
Ha:   0
H0: = 0
Ha:   0
Residual, standar kesalahan dari estimasi, dan

C.    Residual
Residual dari model regresi adalah perbedaan antara nilai y dan prediksi nilai .
Residual untuk model regresi berganda dipecahkan untuk menghitung dengan cara yang sama dengan pengurangan sederhana. Pertama-tama, menentukan nilai  yang dapat ditentukan dengan memasukkan nilai untuk setiap variabel independen untuk suatu set pengamatan ke dalam persamaan regresi berganda. Kemudian, nilai dari   dihitung untuk setiap set pengamatan.
SSE dan Standar Kesalahan dari Estimasi
Salah satu sifat dari model regresi adalah bahwa jumlah residual berjumlah nol. Sifat yang dimiliki ini akan menghalangi kemungkinan dari menghitung rata-rata residual sebagai suatu ukuran tunggal dari kesalahan. Dalam usahanya untuk menghitung statistik tunggal yang menggambarkan kesalahan dalam analisis regresi, sifat jumlah nol dapat diatasi dengan cara memangkatkan residual dan kemudian menjumlahkan kuadrat. Seperti dalam halnya pemberlakuan sum of squares of error (SSE).
Rumus untuk mengitung SSE untuk regresi berganda sama seperti regresi sederhana, yaitu:
SSE juga dapat diperoleh langsung dari regresi berganda dengan cara menyeleksi sum of squares (SS) yang tertulis disebelah error.
SSE telah membatasi penggunaan dalam pengukuran kesalahan. Bagaimanapun juga, SSE merupakan alat yang digunakan untuk menghitung pengukuran yang lebih berguna. Salah satu kegunaannya adalah untuk menghitung standar kesalahan dalam estimasi (), yang pada dasarnya merupakan standar deviasi dari residual untuk model regresi.
Standar kesalahan dari estimasi dapat dihitung dari SSE dengan degrees of freedom dari kesalahan untuk model dan mengambil hasil akar.
Rumus:
Dimana:
n          : jumlah penelitian
k          : jumlah variabel independen


Koefisien dari Penentuan Berganda ()
Koefisien dari penentuan berganda () sejalan dengan koefisien penentuan (). Hal ini menggambarkan proporsi variasi dari variabel dipenden, y dihitung dengan variabel independen dalam model regresi.  Sama seperti dengan , jarak dari nilai yang mungkin untuk  adalah dari 0 sampai 1.  dari nol menunjukkan tidak ada hubungan antara variabel prediksi didalam model dan y. dari satu menunjukkan bahwa keseluruhan dari variabilitas y telah dihitung. Tentu saja hal ini diinginkan agar menjadi tinggi, menunjukkan kuatnya memprediksi model regresi. Koefisien dari penentuan berganda dapat dihitung dengan rumus:
 yang Disesuaikan
Penambahan variabel independen ditambahkan untuk model regresi, nilai dari  tidak bisa dikurang, dan dalam hampir setiap kasus akan meningkat.
Rumus untuk menentuka :
Nilai dari  untuk suatu set penelitian akan bertahan seperti variabel indepenen untuk dimasukkan kedalam analisis regresi dikarenakan  merupakan sum of squares untuk variabel dipenden.
Bagaimanapun juga, terkadang variabel independen tambahan akan menambahkan informasi yang tidak signifikan untuk model regresi, oleh karena itu, memiliki kemungkinan untuk meningkatkan angka. Ahli statistik telah mengembangkan  yang disesuaikan untuk mempertimbangkan informasi tambahan yang dimiliki oleh setiap variabel independen baru yang dibawa untuk model regresi dan mengubah derajat dari kebebasan regresi. Sekarang  banyak paket komputer statistik standar yang dapat menghitung dan melaporkan  yang disesuaikan sebagai bagian dari output. Rumus untuk mengitung  yang disesuaikan adalah

D.    Studi Kasus

STARBUCKS MEMPERKENALKAN KARTU DEBIT
               Starbucks adalah kisah restoran sukses besar. Awal dengan rumah kopi pertama di tahun 1971, Starbucks telah berkembang lebih dari 11.000 lokasi di AS. Membuka nya internasional pertama stopkontak pada pertengahan tahun 1990, Starbucks sekarang beroperasi di lebih dari 43 negara (1800 rumah kopi) di luar Utara Amerika. Selain menjual minuman, kue-kue, permen, dan aksesoris terkait kopi dan peralatan di gerai ritel, Starbucks juga pembelian dan daging panggang biji kopi berkualitas tinggi di beberapa lokasi. Tujuan perusahaan adalah untuk menjadi merek paling diakui dan dihormati di dunia. Starbucks mempertahankan orientasi lingkungan yang kuat dan berkomitmen untuk mengambil posisi kepemimpinan lingkungan. Sebagai tambahan, perusahaan telah memenangkan penghargaan untuk tanggung jawab sosial perusahaan melalui program pembangunan masyarakat, komitmen yang kuat ke asal-usulnya (produsen kopi, keluarga, masyarakat), dan Starbucks Foundation, yang didedikasikan untuk menciptakan harapan, penemuan, dan kesempatan dalam masyarakat di mana Starbucks berada.
               Pada bulan November 2001, Starbucks meluncurkan Kartu prabayar (debit) Starbucks. Kartu, yang memegang antara $ 5 dan $ 500, dapat digunakan di hampir semua lokasi Starbucks. Kartu itu begitu populer ketika pertama kali dirilis bahwa banyak toko kehabisan.
               Pada pertengahan tahun 2002, Starbucks telah diaktifkan lebih dari 5 juta kartu ini. Starbucks Card telah melampaui $ 2500000000 mark total aktivasi dan isi ulang sejak diperkenalkan. Sebagai pelanggan "reload" kartu, tampaknya mereka menempatkan lebih banyak uang pada mereka dari nilai awal kartu. Starbucks telah pergi untuk mempromosikan Kartu Starbucks mereka sebagai alat pemasaran yang fleksibel yang dapat digunakan oleh individu sebagai karunia terima kasih dan penghargaan untuk persahabatan atau layanan dan dapat digunakan oleh perusahaan untuk menghargai pelanggan setia dan sebagai insentif untuk karyawan.
Diskusi
1.      Starbucks menikmati kesuksesan besar dengan kartu debit , yang mereka jual sebesar $ 5 sampai $ 500 . Misalkan manajemen Starbucks ingin mempelajari alasan mengapa beberapa orang membeli kartu debit dengan jumlah prabayar lebih tinggi daripada lainnya orang-orang. Misalkan sebuah studi dari 25 pembeli kartu prabayar yang dipilih secara acak diambil . Responden ditanya jumlah kartu prabayar , usia pelanggan , nomor hari per bulan nasabah melakukan pembelian di Starbucks , jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan . Data ikuti . Menggunakan data ini , mengembangkan model regresi untuk mempelajari seberapa baik jumlah kartu prabayar dapat diprediksi oleh variabel lain dan yang variabel tampaknya lebih menjanjikan dalam melakukan prediksi . apa implikasi penjualan  mungkin terlihat dari analisis ini?

2.      Pemasaran misalkan ingin dapat profil sering pengunjung ke toko Starbucks. Menggunakan data yang sama ditetapkan sudah tersedia, mengembangkan model regresi berganda untuk memprediksi Hari per bulan di Starbucks oleh Umur, Pendapatan, dan Nomor cangkir kopi per hari. Seberapa kuat adalah model? Yang variabel independen tertentu tampaknya memiliki lebih banyak janji dalam memprediksi berapa hari per bulan pelanggan mengunjungi Starbucks? implikasi pemasaran apa yang mungkin terbukti dari analisis ini?
3.      Selama dekade terakhir atau lebih, Starbucks telah berkembang cukup pesat. Ketika mereka menambahkan toko dan meningkatkan jumlah minuman, pendapatan penjualan mereka meningkat. Dalam merefleksikan tentang ini pertumbuhan, berpikir tentang beberapa variabel lain yang mungkin terkait dengan peningkatan Starbucks pendapatan penjualan. Beberapa data selama tujuh tahun terakhir pada jumlah Starbucks toko (seluruh dunia), perkiraan pendapatan penjualan (dalam $ juta), jumlah minuman yang berbeda yang dijual, dan rata-rata mingguan pendapatan pekerja produksi AS yang diberikan di sini. Angka merupakan perkiraan. Mengembangkan regresi berganda Model untuk memprediksi pendapatan penjualan dengan jumlah minuman yang dijual, jumlah toko, dan pendapatan rata-rata mingguan. Bagaimana model kuat? Apa prediksi kunci, jika ada? Bagaimana mungkin analisis ini membantu manajemen Starbucks mencoba untuk menentukan apa yang mendorong pendapatan penjualan?



Jawab :
1.      dan 2. Menghitung regresi statistik menggunakan excel
Koefisien Korelasi sebesar 0,755 (R Square) menunjukan bahwa variable jumlah kartu prabayar, usia pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan memiliki hubungan linier dengan arah positif.
Koefisien determinasi sebesar 0,869 (multiple R) menunjukan bahwa variable usia pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan memberikan pengaruh sebesar 86,9 persen terhadap variable jumlah kartu prabayar atau dengan kata lain dapat dikatakan bahwa variable jumlah kartu prabayar dipengaruhi oleh usia pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan sebesar 86,9 persen
Interpretasi dari r-square adjusted ialah variable y mampu dijelaskan oleh variable x sebesar 70,56 %.
Pengujian Model Regresi
Langkah 1 : Menentukan Hipotesis penelitian
Ho : β = 0 ( tidak ada hubungan antara variable jumlah kartu prabayar, usia pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan)
Ha : β ≠ 0 (ada hubungan antara variable jumlah kartu prabayar, usia pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan)
Langkah 2 : Membandingkan nilai P-Value dengan  nilai α
P-value (Significance F) (6,75799281711087E-06) lebih kecil dari nilai α (0,05) maka gagal menolak Ho ( Ho diterima)
Membandingkan nilai F test dan F kritis
F test 2,87 < F kritis 15,378 maka ho diterima
Langkah 3 : Kesimpulan
Karena ho terima maka  tidak ada hubungan antara variable jumlah kartu prabayar, usia pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan
Analisis kontribusi dari variable independen
Membandingkan nilai t test dengan nilai t kritis
Df = n – (k+1) = 25 – (4+1) = 20
Untuk parameter x1
T kritis (1,725) > t test (0,411401502266763) Ho diterima
Untuk parameter x2
T kritis (1,725) > t test (0,807130365668201) Ho diterima
Untuk parameter x3
T kritis (1,725) > t test (0,540321052009064) Ho diterima
Untuk parameter x4
T kritis (1,725) < t test (6,69006207974477) Ho ditolak
Membuat Kesimpulan
Karena ho ditolak, maka variable x1, x2, x3 tidak memberikan pengaruh yang cukup besar terhadap variable y sedangkan variable x4 memberikan pengaruh terhadap variable y

Dari Aplikasi Excel diatas maka kita bisa menentukan model regresinya, yaitu :
ŷ = -83,826 + 0,237 x1 + 1,189 x2 + 1,422 x3 + 2,407 x4
3. Menghitung regresi statistik menggunakan excel
Koefisien Korelasi sebesar 0,954 (R Square) menunjukan bahwa variable jumlah toko  Starbucks (seluruh dunia), pendapatan penjualan (dalam $ juta), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi memiliki hubungan linier dengan arah positif.
Koefisien determinasi sebesar 0,977 (multiple R) menunjukan bahwa variable jumlah toko  Starbucks (seluruh dunia), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi memberikan pengaruh sebesar 97,7 persen terhadap variable pendapatan penjualan (dalam $ juta) atau dengan kata lain dapat dikatakan bahwa variable pendapatan penjualan (dalam $ juta) dipengaruhi oleh faktor variable jumlah toko  Starbucks (seluruh dunia), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi sebesar 97,7 persen
Interpretasi dari r-square adjusted ialah variable y mampu dijelaskan oleh variable x sebesar 90,77 %.
Pengujian Model Regresi
Langkah 1 : Menentukan Hipotesis penelitian
Ho : β = 0 (tidak ada hubungan antara variable jumlah toko  Starbucks (seluruh dunia), pendapatan penjualan (dalam $ juta), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi)
Ha : β ≠ 0 (ada hubungan antara variable jumlah toko  Starbucks (seluruh dunia), pendapatan penjualan (dalam $ juta), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi)
Langkah 2 : Membandingkan nilai P-Value dengan  nilai α
P-value (Significance F) (0,0165925333478546) lebih kecil dari nilai α (0,05) maka gagal menolak Ho ( Ho diterima)
Membandingkan nilai F test dan F kritis
F test 9,28 < F kritis 20,6714184114723 maka ho diterima
Langkah 3 : Kesimpulan
Karena ho terima maka  tidak ada hubungan antara variable jumlah toko  Starbucks (seluruh dunia), pendapatan penjualan (dalam $ juta), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi
Analisis kontribusi dari variable independen
Membandingkan nilai t test dengan nilai t kritis
Df = n – (k+1) = 7 – (3+1) = 3
Untuk parameter x1
T kritis (2,353) > t test (1,76516077430032) Ho diterima
Untuk parameter x2
T kritis (2,353) > t test (1,62950743890224) Ho diterima
Untuk parameter x3
T kritis (2,353) > t test (-0,511755595018145) Ho diterima
Membuat Kesimpulan
Karena ho diterima, maka variable x1, x2, x3 tidak memberikan pengaruh yang cukup besar terhadap variable y s

Dari Aplikasi Excel diatas maka kita bisa menentukan model regresinya, yaitu :
ŷ = -526,836 + 0,325 x1 + 68,655 x2 + -0,811 x3
E.      MODEL NONLINEAR: TRANSFORMASI MATEMATIKA
Model regresi yang disajikan sejauh didasarkan pada model regresi linear umum, yang memiliki bentuk
= βo + βX + βX + βX……. βnXn + ε
Dimana:
ε = kesalahan acak atau random error
βo = perpotongan atauinterceptgaris terhadap sumbu Y
β = kemiringan atau slope garis yang menggambarkan perubahan bersih Y perunit perubahan  X1
βn = kemiringan atau slope garis yang menggambarkan perubahan bersih Y perunit perubahan  Xn
Dalam model linear umum ini, parameternya linear.
Bagaimanapun  Ini tidak berarti bahwa variabel dependen, y, yang tentu linear berhubungan dengan variabel prediktor. Pencar plot kadang-kadang mengungkapkan hubungan lengkung antara x dan y. Beberapa permukaan respon regresi tidak terbatas pada permukaan linear dan mungkin saja berbentuk lengkung.
Untuk saat ini, variabel, xi, telah mewakili prediktor yang berbeda. Sebagai contoh, sebuah situs model pemasaran dapat dikembangkan di mana lokasi penjualannya terletak, sebagai variabel respon, diprediksi oleh kepadatan penduduk, jumlah pesaing, ukuran toko, dan jumlah tenaga penjualan. model seperti itu bisa mengambil bentuk:
           
            Model regresi ini memiliki empat variabel xi, yang masing-masing mewakili berbeda
prediktor. Model linear umum juga berlaku untuk situasi di mana beberapa xi mewakili recoded data dari variabel prediktor yang sudah diwakili dalam model dengan variabel independen lain. Dalam beberapa model, xi merupakan variabel yang telah mengalami transformasi matematika untuk memungkinkan model untuk mengikuti bentuk model linier umum.
            Dalam bagian ini dari bab ini, kita membahas beberapa model-model lainnya, termasuk model polinomial regresi, model regresi dengan interaksi, dan model dengan variabel berubah.
1.      Regresi Polinomial
Model regresi di mana kekuasaan tertinggi dari setiap variabel prediktor adalah 1 dan di mana tidak ada interaksi hal-lintas produk (xi xj). Model umum untuk regresi sederhana adalah:
Jika variabel independen kedua ditambahkan, model ini disebut sebagai model orde pertama dengan dua variabel independen dan muncul sebagai:
Model regresi polinomial adalah model regresi yang kedua atau model tingkat tinggi. Mereka berisi kuadrat, potong dadu, atau kekuatan yang lebih tinggi dari variabel prediktor (s) dan mengandung permukaan respon yang lengkung. Namun, mereka masih kasus khusus dari model linear umum yang diberikan dalam rumus 14.1.
Pertimbangkan model regresi dengan satu variabel independen mana model termasuk prediktor kedua, yang merupakan variabel bebas kuadrat. Model seperti ini disebut sebagai model orde kedua dengan satu variabel independen karena kekuasaan tertinggi di antara prediktor adalah 2, namun masih ada hanya satu variabel independen. Model ini mengambil bentuk berikut:

Model ini dapat digunakan untuk mengeksplorasi kemungkinan fit dari model kuadrat dalam memprediksi Model variable. Aquadratic tergantung adalah model regresi berganda dimana prediktor adalah variabel dan kuadrat variabel. x2 dari model linear umum sama dengan x2 1 maka  menjadi  
Analisis regresi berganda mengasumsikan koefisien regresi linear dan
regresi konstan, tetapi belum tentu hubungan linear dari nilai-nilai variabel independen (x). Oleh karena itu, peneliti sering dapat mencapai regresi lengkung dengan pengodean ulang data sebelum analisis regresi berganda dicoba.
Sebagai contoh, mempertimbangkan data yang diberikan dalam Tabel 14.1. yang telah dipindahkan dalam excel Tabel ini berisi volume penjualan (dalam $ juta) untuk 13 perusahaan manufaktur bersama dengan jumlah perwakilan produsen yang terkait dengan masing-masing perusahaan. Sebuah analisis regresi sederhana untuk memprediksi penjualan dengan jumlah perwakilan produsen hasil dalam output Excel pada Gambar 14.1.
Hasilnya dalam formulasi excel adalah:

Output regresi ini menunjukkan model regresi dengan r 2 dari 87.0%, kesalahan standar estimasi sama dengan 51,10, tes F keseluruhan signifikan untuk model, dan rasio t signifikan untuk jumlah prediktor perwakilan produsen.
Gambar 14.2 (a) adalah plot pencar untuk data pada Tabel 14.1. Perhatikan bahwa plot jumlah perwakilan dan penjualan bukan merupakan garis lurus dan merupakan indikasi bahwa hubungan antara dua variabel mungkin lengkung. Untuk mengeksplorasi kemungkinan bahwa hubungan kuadrat mungkin ada di antara penjualan dan jumlah perwakilan, peneliti bisnis menciptakan variabel prediktor kedua, (jumlah perwakilan produsen) 2, untuk digunakan dalam analisis regresi untuk memprediksi penjualan bersama dengan sejumlah perwakilan produsen, seperti yang ditunjukkan pada Tabel 14.2. Dengan demikian, variabel dapat dibuat untuk mengeksplorasi orde kedua hubungan parabola dengan mengkuadratkan data dari variabel independen dari model linear dan masuk ke dalam analisis. Gambar 14.2 (b) adalah plot pencar penjualan dengan (jumlah repetisi pabrikan). Perhatikan bahwa grafik ini, dengan istilah kuadrat, lebih dekat mendekati garis lurus daripada grafik pada Gambar 14.2 (a). Dengan pengodean ulang variabel prediktor, peneliti menciptakan fit regresi yang berpotensi lebih baik.
Dengan data ini, model regresi berganda dapat dikembangkan. Gambar 14.3 menunjukkan output Excel untuk analisis regresi untuk memprediksi penjualan dengan jumlah perwakilan produsen dan (jumlah perwakilan produsen).
Memeriksa output pada Gambar 14.3 dan membandingkannya dengan output pada Gambar 14.1 untuk model regresi sederhana. R2 untuk model ini adalah 97,3%, yang merupakan kenaikan dari r 2 dari 87,0% untuk model prediksi linear tunggal. Standard error dari estimasi untuk model ini adalah 24,59, yang jauh lebih rendah dari 51,10 nilai yang diperoleh dari model regresi sederhana. Ingat, angka penjualan $ juta. Model kuadrat mengurangi estimasi standar error dengan 26,51 ($ 1.000.000), atau $ 26.510.000. Tampaknya bahwa model kuadrat adalah model yang lebih baik untuk memprediksi penjualan.
Pemeriksaan t statistik untuk jangka kuadrat dan probabilitas yang terkait di
Gambar 14.3 menunjukkan bahwa secara statistik signifikan pada ᾀ = 0,001 (t = 6,12 dengan probabilitas 0,0001). Jika t statistik ini tidak signifikan, peneliti akan paling mungkin menghentikan istilah kuadrat dan kembali ke model orde pertama (model regresi sederhana).
Secara teori, model ketiga dan tingkat tinggi dapat dieksplorasi. Secara umum, bisnis
peneliti cenderung memanfaatkan model pertama dan regresi orde kedua lebih dari model higherorder. Ingat bahwa analisis regresi yang paling digunakan dalam bisnis untuk membantu pengambilan keputusan. model yang lebih tinggi-daya (ketiga, keempat, dll) menjadi sulit untuk menafsirkan dan sulit untuk menjelaskan kepada para pengambil keputusan. Selain itu, peneliti bisnis biasanya mencari tren dan arah umum. Semakin tinggi urutan pemodelan regresi, model yang lebih cenderung mengikuti fluktuasi teratur daripada arah yang bermakna.

Hasilnya setelah melalui proses di Ms.Excel adalah:
2.      Transformasi dari Ladder Tukey
Seperti hanya ditunjukkan dengan contoh manufaktur, pengodean ulang data dapat menjadi alat yang berguna dalam meningkatkan model regresi fit. Banyak cara lain data recoding dapat dieksplorasi dalam proses ini. John W. Tukey menyajikan "tangga ekspresi" yang dapat dieksplorasi untuk meluruskan sebidang x dan y, sehingga menawarkan potensi peningkatan prediktabilitas model regresi. Tangga transformasi Tukey memberikan ekspresi berikut untuk kedua x dan y.


tangga ini menunjukkan cara-cara potensial pengguna recode data. Tukey menterbitkan pendekatan empat kuadran untuk menentukan ekspresi tangga yang lebih tepat untuk situasi tertentu. Pendekatan ini didasarkan pada bentuk plot pencar x dan y. Gambar 14.4 menunjukkan empat kuadran dan ekspresi pengodean ulang terkait. Sebagai contoh, jika plot pencar x dan y menunjukkan bentuk seperti yang ditunjukkan pada kuadran kiri atas, recoding harus bergerak "menuruni tangga" untuk variabel x terhadap
atau "menaiki tangga" untuk y variabel terhadap
atau "menuruni tangga" untuk y variabel terhadap
           
Dalam contoh manufaktur, grafik pada Gambar 14.2 (a) berbentuk seperti kurva di
kuadran kanan bawah dari pendekatan maka empat kuadran Tukey menunjukkan bahwa peneliti bisnis bergerak "naik tangga" pada x seperti yang dilakukan dengan menggunakan istilah kuadrat. Peneliti bisa menjelajahi pilihan lain seperti melanjutkan menaiki tangga dari x atau turun tangga y. tangga Tukey adalah kontinum dan meninggalkan terbuka kemungkinan recoding lainnya antara ekspresi. Misalnya, antara x2 dan x3 banyak kekuatan yang mungkin dari x yang bisa dieksplorasi, seperti X2.1, x2.5, atau x2.86.
3.      Model Regresi dengan Interaksi
Model regresi dengan Interaksi seringkali ketika dua variabel independen yang berbeda yang digunakan dalam analisis regresi, interaksi terjadi antara dua variabel. Interaksi ini telah dibahas dalam Bab 11 dalam analisis dua arah varians, di mana satu variabel akan bertindak berbeda selama rentang tertentu nilai untuk variabel kedua daripada yang dilakukannya selama rentang lain nilai untuk variabel kedua. Misalnya, di pabrik, suhu dan kelembaban mungkin berinteraksi sedemikian rupa untuk memberikan efek pada kekerasan bahan baku. Kelembaban udara dapat mempengaruhi bahan baku berbeda pada temperatur yang berbeda.
Dalam analisis regresi, interaksi dapat diperiksa sebagai variabel independen yang terpisah. Variabel interaksi prediktor dapat dirancang dengan mengalikan nilai data satu variabel dengan nilai-nilai dari variabel lain, sehingga menciptakan sebuah variabel baru. Sebuah model yang mencakup variabel interaksi

Analisis untuk mengeksplorasi efek interaksi dengan memasukkan istilah interaksi dalam persamaan.
persamaan sesuai dengan bentuk model linier umum
Dimana x3 = x1x2. Setiap pengamatan individu x3 diperoleh melalui rekaman
Proses dengan mengalikan pengamatan terkait dari x1 dan x2.
Gambar 14.6 (a) adalah permukaan respon untuk model pertama regresi disajikan pada Gambar 14.5 (model tanpa interaksi). Ketika Anda mengamati pesawat respon dengan saham 3 sebagai titik acuan, Anda melihat pesawat bergerak ke atas dengan meningkatnya nilai saham 1 sebagai pesawat bergerak menjauh dari Anda terhadap nilai-nilai yang lebih kecil dari 2. Sekarang saham pada Gambar 14.6 (b), permukaan respon untuk model regresi kedua disajikan pada Gambar 14.5 (model dengan interaksi). Perhatikan bagaimana pesawat respon dipelintir, dengan perubahan kemiringan sebagai bergerak bersama saham 2. Pola ini disebabkan oleh efek interaksi saham 2 harga dan stok 3 harga.
Sebuah penampang dari pesawat diambil dari kiri ke kanan pada setiap pengait harga saham 2 menghasilkan garis yang mencoba untuk memprediksi harga saham 3 dari harga saham 1. Ketika Anda bergerak kembali melalui harga yang berbeda dari saham 2, lereng itu menunjukkan perubahan garis, menunjukkan bahwa hubungan antara saham 1 dan stok 3 bervariasi sesuai stock 2.
Seorang peneliti juga bisa mengembangkan model menggunakan dua variabel bebas dengan mereka kotak dan interaksi. Model seperti itu akan menjadi model orde kedua dengan dua variabel independen. model akan terlihat seperti ini.
4.      Model Transformasi
Untuk saat ini dalam memeriksa model polinomial dan interaksi, telah fokus di pengodean ulang nilai-nilai x variabel. Beberapa situasi regresi berganda mengharuskan variabel dependen, y, akan pengkodean ulang. Untuk menguji hubungan yang berbeda antara x dan y, analisis empat kuadran Tukey dan tangga transformasi dapat digunakan untuk mengeksplorasi cara untuk pengkodean ulang x atau y dalam upaya untuk membangun model regresi dengan lebih prediktabilitas. Termasuk di tangga yang seperti transformasi y sebagai log y dan 1 / y.
Misalkan data berikut mewakili penjualan tahunan dan pengeluaran iklan tahunan oleh tujuh perusahaan.
Setelah melalui proses komputerisasi hasilnya adalah:

Namun,apabila menggunakan cara manual salah satu model matematika yang merupakan penguji yang baik bagi data ini adalah model eksponensial dalam bentuk
Model ini dapat diubah (dengan mengambil log dari setiap sisi) sehingga dalam bentuk dari persamaan linear umum.
Model berubah ini membutuhkan recoding dari data y melalui penggunaan logaritma. Perhatikan bahwa x tidak di kode ulang tapi tetap konstan regresinya dan koefisien dalam skala logaritmik. Jika kita membiarkan  eksponensial model dalam bentuk model linier umum.
Proses dimulai dengan mengambil log dari nilai-nilai y. Data yang digunakan untuk membangun model regresi dan output regresi Excel untuk data ini mengikuti.

Sebuah model regresi sederhana (tanpa pengodean ulang log dari variabel y) menghasilkan R2 sebesar 87%, sedangkan model eksponensial R2 adalah 98%. T statistik untuk iklan adalah 15,82 dengan p-nilai 0,00001834 dalam model eksponensial dan 5.77 dengan p-nilai 0,00219 dalam model regresi sederhana. Dengan demikian model eksponensial memberikan lebih cocok daripada model regresi sederhana. Pemeriksaan (x2, y) dan (x3, y) model mengungkapkan R2 dari 0,930 dan 0,969, masing-masing, yang cukup tinggi tetapi masih tidak sebagus R2 yang dihasilkan oleh model eksponensial (output untuk model ini adalah tidak ditampilkan di sini). Persamaan yang dihasilkan dari model regresi eksponensial adalah
Dalam menggunakan persamaan regresi ini untuk menentukan nilai prediksi dari y untuk x, ingat yang dihasilkan diperkirakan y nilai dalam bentuk logaritmik dan antilog dari yang diprediksi y harus diambil untuk mendapatkan nilai y yang diprediksi dalam satuan baku. Misalnya, untuk mendapatkannya diprediksi nilai y (penjualan) untuk seorang tokoh periklanan 2.0 ($ juta), pengganti x = 2.0 ke dalam persamaan regresi.
Log dari penjualan 3,8505. Mengambil antilog dari 3,8505 hasil dalam penjualan diprediksi di unit baku.
Dengan demikian, model regresi eksponensial memprediksi bahwa $ 2,0 juta dari iklan akan menghasilkan $ 7,087.61 juta penjualan.
Cara lain dapat digunakan untuk mengubah model matematika sehingga mereka dapat diperlakukan seperti model linear umum. Salah satu contoh adalah model terbalik seperti
                                                       
Model seperti itu dapat dimanipulasi aljabar ke dalam bentuk
           
Mensubstitusi  ke dalam persamaan ini menghasilkan persamaan yang dalam bentuk
model linear umum
           
Untuk menggunakan ini model "terbalik", recode nilai data untuk y dengan menggunakan 1 y. Regresi Analisis dilakukan pada data 1 y, x1, dan x2. Untuk mendapatkan nilai prediksi dari y dari model ini, masukkan nilai baku dari x1 dan x2. nilai prediksi yang dihasilkan dari y dari persamaan regresi akan menjadi kebalikan dari yang sebenarnya diprediksi nilai y.
DEMONSTRASI PERMASALAHAN
Dalam industri kedirgantaraan dan pertahanan, beberapa perkiraan biaya memprediksi
biaya proyek ruang baru dengan menggunakan model matematis yang
menerima sesuatu bentuk

Estimator biaya ini sering menggunakan berat benda yang dikirim ke ruang angkasa sebagai prediktor (x) dan biaya objek sebagai variabel dependen (y). Cukup sering β ternyata menjadi nilai antara 0 dan 1, sehingga nilai prediksi y menyamai
beberapa akar x.
Gunakan data biaya sampel yang diberikan di sini untuk mengembangkan model biaya regresi di Formulir hanya ditampilkan untuk menentukan persamaan untuk nilai prediksi y. Gunakan ini persamaan regresi untuk memprediksi nilai y untuk x = 3.000

Penyelesaian
persamaan
tidak dalam bentuk model linear umum, tetapi dapat diubah dengan menggunakan
logaritma:
           
yang mengambil bentuk linear umum
           
Persamaan ini membutuhkan baik x dan y disimpan dengan mengambil logaritma dari masing-masing
Menggunakan data ini, komputer menghasilkan konstanta regresi berikut dan koefisien:
bo = -1.25292 b1 = 0.49606
log y = -1.25292 + 0.49606logX
bila X = 3000, log X = 3.47712
log y = -1.25292 + 0.49606 (3.47712) = 0.47194
lalu,
            y = antilog(log y) = antilog (0.47194) = 2.9644

Maka, nilai prediksi dari y adalah $ 2964400000 untuk berat x = 3000 ton.
Mengambil antilog dari b0 = -1,25292 menghasilkan 0,055857. Dari ini dan b1 = 0,49606, model dapat ditulis dalam bentuk aslinya:
           
Dengan mensubstitusi X + 3000 ke dalam rumus ini juga menghasilkan $ 2964500000 untuk nilai prediksi y.






F.     Indicator (Dummy) Variables
            Beberapa variabel disebut sebagai variabel kualitatif. Variabel kualitatif menghasilkan informasi nominal atau ordinal, yang lebih digunakan untuk mengkategorikan sesuatu. Variabel tersebut memiliki peran dalam regresi berganda dan disebut sebagai indikator, atau variabel dummy. Pada bagian ini, kita akan meneliti peran indikator atau dummy sebagai variabel prediktor atau variabel independen dalam analisis regresi ganda. Variabel indikator muncul dalam banyak cara dalam penelitian bisnis. Kuesioner atau wawancara pribadi pertanyaan demografi adalah kandidat utama karena mereka cenderung menghasilkan langkah-langkah kualitatif pada item seperti jenis kelamin, wilayah geografis, pekerjaan, status perkawinan, tingkat pendidikan, kelas ekonomi, agama, metode transportasi, atau jenis broker.
            Kebanyakan peneliti memberikan kode variabel indikator dengan menggunakan 0 atau 1. Sebagai contoh, dalam penelitian pusat perbelanjaan, mal yang terletak di tepi Danau Erie diberi kode 1, dan semua mal lain kemudian akan diberi kode 0. Penentuan kode 0 atau 1 adalah bebas dengan maksud tempat untuk kategori saja, bukan berarti data dengan kode 0 lebih baik daripada data dengan kode 1. Untuk alasan tersebut, coding ini disebut sebagai "dummy" coding, dimana nomor mewakili kategori dengan memegang tempat dan tidak sebagai pengukur. Banyak indikator atau dummy variabel dikotomis, seperti laki-laki / perempuan, salad bar / tidak ada salad bar, bekerja / tidak bekerja, dan sewa / rumah sendiri.
            Jika variabel indikator memiliki kategori c, maka variabel dummy dihitung dengan c - 1 dan dimasukkan ke dalam analisis regresi untuk memasukkan variabel indikator dalam regresi ganda. Misalkan seorang peneliti menggunakan analisis regresi berganda untuk memprediksi biaya melakukan bisnis dan lokasi geografis dari kantor adalah prediktor potensial. Jumlah c = 4 untuk pertanyaan ini, maka tiga variabel dummy dimasukkan ke dalam analisis.
Contoh :
Text Box: Dimana 0 adalah perempuan dan 1 adalah laki – laki.




Berdasarkan tabel diatas, maka persamaan garis untuk contoh ini adalah y = 732,06 + 11,12 (umur) + 458,7 (jenis kelamin)
            Pengujian pada rasio t menyatakan bahwa variabel dummy "jenis kelamin" memiliki koefisien regresi yang signifikan di = 0,001 (t = 8.58, p = 1,82). Keseluruhan model adalah signifikan pada = 0,001 (F = 48,54, p = 0,000). Standard error dari estimasi, se = 96,79157833, menunjukkan bahwa sekitar 68% dari kesalahan prediksi berada dalam $ 96,79. R2 relatif tinggi di 89,0%, dan disesuaikan R2 adalah 87,2%. Nilai T untuk jenis kelamin menunjukkan bahwa itu adalah prediktor signifikan dari gaji bulanan dalam model ini. Ketika jenis kelamin = 1 (laki-laki), rumus regresi menjadi y = 1190,76 + 11,12 (umur) dan kertika jenis kelamin = 0 (perempuan), rumus regresi menjadi y = 732,06 + 11,12 (umur). Perbedaan intercept dari kedua persamaan adalah 0,459; yang merupakan nilai koefisien regresi untuk jenis kelamin. Intercept ini menunjukkan signifikansi bahwa rata-rata pria mendapatkan $ 459 per bulan lebih dari perempuan untuk populasi ini.





G.    Model Building : Search Procedures
Search procedures adalah proses dimana lebih dari satu model regresi berganda dikembangkan untuk database yang diberikan, dan model dibandingkan dan diurutkan berdasarkan kriteria yang berbeda, tergantung pada prosedur yang diberikan.
All Possible Regression
Menghitung semua kemungkinan model regresi linier berganda dari data menggunakan semua variabel. Jika sekumpulan data mengandung variabel independen k, semua kemungkinan regresi akan menentukan model - 1 berbeda.
Stepwise Regression                 
Melibatkan dua jenis proses yaitu: forward selection dan backward elimination. Teknik ini dilakukan melalui beberapa tahapan. Pada masing-masing tahapan, kita akan memutuskan variabel mana yang merupakan prediktor terbaik untuk dimasukkan ke dalam model. Variabel ditentukan berdasarkan uji F, variabel ditambahkan ke dalam model selama nilai p-valuenya kurang dari nilai kritis α (biasanya 0,15). Kemudian variabel dengan nilai p-value lebih dari nilai kritis α akan dihilangkan. Proses ini dilakukan terus menerus hingga tidak ada lagi variabel yang memenuhi kriteria untuk ditambahkan atau dihilangkan.
Model dalam stepwise regression adalah:
Y = β0 + β1X1 + β2X2 + β3X3 + …. + βnXn
Sedangkan hipotesis yang digunakan dalam stepwise regression adalah:
H0 : β1, β2, β3 = 0
Ha : β1, β2, β3 ≠ 0
Backward Elimination
Membuat model dengan memasukkan semua variabel kemudian dikeluarkan satu persatu dengan melakukan pengujian terhadap parameter–parameternya dengan menggunakan partial F test. Nilai partial F-test (FL) terkecil dibandingkan dengan F0 tabel:
• Jika FL < F0, maka X yang bersangkutan dikeluarkan dari model dan dilanjutkan dengan pembuatan model baru tanpa variabel tersebut
• Jika FL > F0, maka proses dihentikan dan persamaan terakhir tersebut yang digunakan/dipilih
Forward Selection
Forward Selection merupakan salah satu metode pemodelan (pembangunan model linier) untuk menemukan kombinasi peubah yang “terbaik” dari suatu gugus peubah. Dalam prosedur forward selection, sekalinya variabel masuk kedalam persamaan maka tidak bisa dihilangkan.
Selain itu, forward selection dapat berarti memasukkan variabel bebas yang memiliki korelasi yang paling erat dengan variabel tak bebasnya (variabel yang paling potensial untuk memiliki hubungan linier dengan Y). Kemudian secara bertahap memasukkan variabel bebas yang potensial berikutnya dan nanti akan terhenti sampai tidak ada lagi variabel bebas yang potensial.
Prosedur Forward Selection
Prosedur forward selection dimulai dengan sebuah persamaan yang terdiri dari suku konstanta, tidak terdiri dari predictor variable. Variabel pertama yang masuk ke dalam persamaan adalah variable yang memiliki simple correlation tertinggi dan signifikan dengan variable Y. Jika koefisien regresi signifikan berbeda dari 0 maka tetap dipakai dalam persamaan, dan dilakukan pencarian variabel kedua. Variabel yang masuk ke dalam persamaan sebagai variable kedua adalah variabel yang memiliki korelasi tertinggi kedua dan masih signifikan dengan Y. Kemudian koefisien regresi dari variabel kedua diuji. Jika signifikan, maka dilakukan pencarian terhadap variabel ketiga dengan cara yang sama. Prosedur dihentikan saat pemasukan variabel terakhir  tidak memiliki koefisien regresi dan tidak signifikan atau semua variable masuk dalam persamaan. Koefisien regresi yang signifikan dari variabel terakhir dilihat dari uji-t dari persamaan terakhir.
Langkah-Langkah Forward Selection:
1. Mulai dengan tidak ada predictor variable (model hanya berisi konstanta)
2. Untuk semua predictor variable tidak dalam model, pilih satu variable dengan  nilai p-value terkecil dan kurang dari taraf nyata α
3. Ulangi langkah kedua hingga tidak terdapat predictor variable yang dapat ditambahkan ke dalam model

H.    Multikolinearitas
               Satu masalah yang bisa timbul dalam analisis regresi berganda adalah multikolinearitas. Multikolinearitas adalah ketika dua atau lebih variabel independen dari regresi berganda Model sangat berkorelasi. Secara teknis, jika dua variabel independen berkorelasi, kami memiliki collinearity; ketika tiga atau lebih variabel independen berkorelasi, kita memiliki multikolinearitas. Namun, kedua istilah ini sering digunakan secara bergantian. Realitas riset bisnis adalah bahwa sebagian besar waktu beberapa korelasi antara prediktor (Variabel independen) akan hadir. Masalah multikolinearitas timbul ketika intercorrelation antara variabel prediktor tinggi. Hubungan ini menyebabkan beberapa masalah lain, terutama dalam penafsiran analisis. 
1.      Sulit, jika tidak mustahil, untuk menafsirkan perkiraan regresi koefisien.
2.      Nilai t terlampau kecil untuk koefisien regresi dapat mengakibatkan.
3.      Standar deviasi dari koefisien regresi berlebihan.
4.      Tanda aljabar estimasi koefisien regresi mungkin kebalikan dari apa yang akan diharapkan untuk variabel prediktor tertentu.
               Masalah multikolinieritas dapat timbul dalam analisis regresi dalam berbagai bisnis
situasi penelitian. Misalnya, kira model sedang dikembangkan untuk memprediksi gaji di suatu industri tertentu. variabel independen seperti tahun pendidikan, usia, tahun di manajemen, pengalaman pada pekerjaan, dan tahun masa jabatan dengan perusahaan mungkin dianggap sebagai prediktor. Hal ini jelas bahwa beberapa dari variabel ini berkorelasi (hampir semua ini variabel ada hubungannya dengan jumlah tahun, atau waktu) dan menghasilkan informasi yang berlebihan.
               Misalkan model regresi keuangan sedang dikembangkan untuk memprediksi pasar obligasi tarif oleh variabel independen seperti Dow Jones rata-rata, tingkat suku bunga prime, GNP, produser Indeks harga, dan indeks harga konsumen. Beberapa prediktor tersebut cenderung intercorrelated.
               Dalam dunia contoh produksi minyak mentah yang digunakan dalam bagian 14.3, beberapa independen variabel intercorrelated, menyebabkan potensi masalah multikolinearitas.
               Tabel 14.15 memberikan korelasi dari variabel prediktor untuk contoh ini. Catatan
bahwa nilai-nilai r yang cukup tinggi (r > 0,90) untuk tingkat bahan bakar dan nuklir (0,972), tingkat bahan bakar dan batubara (0,968), dan batubara dan nuklir (0,952).
               Tabel 14.15 menunjukkan bahwa tingkat bahan bakar dan produksi batubara sangat berkorelasi. menggunakan tingkat bahan bakar sebagai prediktor tunggal produksi minyak mentah menghasilkan model regresi sederhana berikut
ŷ = 44.869 + .7838 (fuel rate)
               Perhatikan bahwa estimasi koefisien regresi , 0,7838 , adalah positif , menunjukkan bahwa dengan meningkatnya tingkat bahan bakar, produksi minyak meningkat . Menggunakan batubara sebagai prediktor tunggal minyak mentah produksi menghasilkan model regresi sederhana berikut.
ŷ = 45.072 + .0157 (coal)


               Model regresi berganda dikembangkan menggunakan kedua tingkat bahan bakar dan batubara untuk memprediksi
produksi minyak mentah
ŷ = 45.806 + .0227 (coal) - .3934 (fuel rate)
               Perhatikan bahwa model regresi ini menunjukkan hubungan negatif antara tingkat bahan bakar dan produksi minyak (-.3934), yang bertentangan dengan hubungan positif yang ditunjukkan pada persamaan regresi untuk tingkat bahan bakar sebagai prediktor tunggal. Karena multikolinearitas antara batubara dan tingkat bahan bakar, dua variabel independen ini berinteraksi dalam regresi analisis dengan cara seperti untuk menghasilkan estimasi koefisien regresi yang sulit menafsirkan. Sangat hati-hati harus dilakukan sebelum menafsirkan koefisien regresi ini memperkirakan. masalah multikolinieritas juga dapat mempengaruhi nilai-nilai t yang digunakan untuk mengevaluasi koefisien regresi. Karena masalah multikolinieritas antara prediktor bisa menghasilkan terlalu tinggi dari standar deviasi dari koefisien regresi, t nilai-nilai cenderung underrepresentative ketika multikolinearitas hadir. Dalam beberapa regresi model yang mengandung multikolinieritas di mana semua nilai t yang tidak signifikan, secara keseluruhan F Nilai untuk model ini sangat signifikan. Dalam Bagian 14.1, contoh diberikan tentang bagaimana termasuk interaksi ketika signifikan memperkuat model regresi. Komputer output untuk model regresi baik dengan dan tanpa istilah interaksi ditunjukkan di Gambar 14.5. Model tanpa interaksi menghasilkan nilai F signifikan secara statistik tetapi tidak variabel prediktor signifikan. Penyelidikan lebih lanjut dari model ini mengungkapkan bahwa korelasi antara dua prediktor, x1 dan x2, adalah 0,945. korelasi yang sangat tinggi ini menunjukkan collinearity yang kuat antara dua variabel prediktor. collinearity ini dapat menjelaskan fakta bahwa model keseluruhan signifikan tetapi tidak prediktor signifikan. Hal ini juga menggarisbawahi salah satu masalah dengan multikolinearitas: nilai t terwakili. Nilai t menguji kekuatan prediksi yang diberikan lainnya variabel dalam model. Jika prediktor sangat berkorelasi dengan variabel independen lain, akan muncul untuk tidak menambahkan banyak untuk penjelasan dari y dan menghasilkan nilai t rendah. Namun, telah prediktor tidak pernah di hadapan variabel-variabel berkorelasi lainnya, prediktor yang mungkin menjelaskan proporsi yang tinggi dari variasi y. Banyak masalah yang diciptakan oleh multikolinearitas masalah interpretasi. Peneliti bisnis harus waspada dan menyadari potensi multikolinearitas dengan prediktor dalam model dan melihat hasil model dalam terang potensi tersebut.
               Masalah multikolinieritas tidak sederhana untuk diatasi. Namun, beberapa metode menawarkan sebuah pendekatan untuk masalah ini. Salah satu cara adalah dengan memeriksa matriks korelasi seperti yang ada di Tabel 14.15 untuk mencari kemungkinan interkorelasi antara potensi prediktor variabel. Jika beberapa variabel yang sangat berkorelasi, peneliti dapat memilih variabel yang paling berhubungan dengan variabel dependen dan menggunakan variabel yang mewakili yang lain dalam analisis. Satu masalah dengan ide ini adalah bahwa korelasi dapat lebih kompleks daripada korelasi sederhana antara variabel. Dengan kata lain, korelasi sederhana nilai tidak selalu mengungkapkan korelasi berganda antara variabel. dalam beberapa contoh, variabel mungkin tidak tampak berkorelasi sebagai pasangan, tapi satu variabel adalah linier kombinasi dari beberapa variabel lain. Situasi ini juga merupakan contoh multikolinearitas, dan pengamatan sepintas dari matriks korelasi akan mungkin tidak mengungkapkan masalah. regresi bertahap adalah cara lain untuk mencegah masalah multikolinearitas. Proses pencarian memasuki variabel satu per satu dan membandingkan variabel baru dengan yang di larutan. Jika variabel baru dimasukkan dan nilai-nilai t pada variabel lama menjadi tidak signifikan, variabel lama putus dari solusi. Dengan cara ini, akan lebih sulit untuk masalah multikolinearitas mempengaruhi analisis regresi. Tentu saja, karena multikolinearitas, beberapa prediktor penting mungkin tidak masuk ke dalam analisis.
               Teknik lain yang tersedia untuk mencoba untuk mengontrol masalah multikolinearitas . Salah satu yang disebut faktor varians inflasi , di mana analisis regresi dilakukan untuk memprediksi variabel independen dengan variabel independen lainnya . Pada kasus ini, variabel independen yang diprediksi menjadi variabel dependen . Karena proses ini dilakukan untuk setiap variabel independen , adalah mungkin untuk menentukan apakah salah satu dari variabel independen adalah fungsi dari variabel independen lain , menghasilkan bukti multikolinearitas . Dengan menggunakan hasil dari model tersebut , inflasi varians Faktor ( VIF ) dapat dihitung untuk menentukan apakah kesalahan standar dari estimasi yang meningkat :
               Di mana  adalah koefisien determinasi untuk salah satu model , digunakan untuk memprediksi independen variabel dengan k lainnya - 1 variabel independen. Beberapa peneliti mengikuti pedoman bahwa faktor varians inflasi lebih besar dari 10 atau   nilai lebih dari 0,90 untuk terbesar faktor varians inflasi menunjukkan masalah multikolinearitas parah . **

I.       Studi Kasus
VIRGINIA SEMICONDUCTOR
               Virginia Semiconductor adalah produsen terkemuka perdana substrat silikon. Perusahaan, yang terletak di Fredericksburg, Virginia, didirikan pada tahun 1978 oleh Dr Thomas G. Digges dan saudaranya, Robert. Virginia Semiconductor (VSI) tumbuh dan makmur pada awal tahun 1980 dengan menjual tinggi volume wafer-profit margin rendah di mikroelektronik industri. Namun, pada tahun 1985, tanpa pemberitahuan, VSI kehilangan dua
pelanggan utama yang mewakili 65% dari bisnisnya. Kiri dengan hanya 35% dari basis penjualan, perusahaan sangat memerlukan pelanggan. Dr. Digges, CEO dari VSI, memutuskan untuk mencari pasar di mana-Nya pangsa pasar perusahaan akan kecil tapi margin laba akan tinggi karena nilai penelitian rekayasa dan keahliannya. Keputusan ini ternyata menjadi arah yang bijaksana untuk kecil, perusahaan serbaguna. VSI dikembangkan silikon wafer itu dua inci diameter, tebal 75 mikron, dan dipoles pada kedua sisi. Wafer seperti yang dibutuhkan oleh beberapa pelanggan tetapi tidak pernah diproduksi sebelumnya. Perusahaan menghasilkan sejumlah wafer ini dan menjual mereka untuk lebih dari 10 kali harga wafer konvensional.
               Segera perusahaan itu membuat wafer dari 2 sampai 4 mikron tebal (sangat tipis), wafer dengan permukaan bertekstur untuk aplikasi inframerah, dan wafer dengan lubang micromachined atau bentuk dan menjualnya di pasar khusus. Itu bisa untuk memberikan produk-produk ini lebih cepat dari pesaing mampu memberikan wafer standar.
               Memiliki membuat terobosan di mengganti kehilangan penjualan, Virginia Semikonduktor masih harus merampingkan operasi dan kontrol persediaan dan biaya. Tidak ada PHK terjadi, tapi rata-rata kerja-minggu turun menjadi 32 jam dan presiden mengambil pengurangan gaji 80% untuk waktu. Beban dipotong sejauh tampak mungkin. Perusahaan memiliki hampir tidak ada jangka panjang hutang dan untungnya mampu membuatnya melalui periode ini tanpa menimbulkan utang yang signifikan tambahan. Tidak adanya pembayaran utang besar bulanan memungkinkan perusahaan untuk merespon dengan cepat kebutuhan produksi baru.
               Virginia Semiconductor meningkatkan kualitas produksi dengan karyawan lintas-pelatihan. Selain itu, perusahaan berpartisipasi di negara bagian upaya pembangunan ekonomi Virginia untuk menemukan pasar di Eropa, Jepang, Korea, dan Israel. ekspor, yang hanya 1% dari bisnis perusahaan pada tahun 1985, tumbuh untuk lebih dari 40%. perusahaan terus mencari pelanggan baru karena pengembangan produk. VSI memiliki distributor produk mereka di 29 negara yang berbeda. Menggarisbawahi nilai inti VSI, dinyatakan pada halaman Web perusahaan: "Seperti biasa, VSI benar-benar dapat membuat wafer silikon untuk spesifikasi apapun dan terus memasok kecil, pesanan rumit untuk dihargai
pelanggan. "
Diskusi
1.      Hal ini sering berguna untuk para pengambil keputusan di sebuah perusahaan untuk menentukan faktor-faktor apa yang masuk ke dalam ukuran pelanggan. pengambil keputusan membeli. Misalkan di Virginia Semikonduktor ingin menentukan dari data masa lalu apa variabel mungkin prediktor ukuran pembelian dan mampu mengumpulkan beberapa data di berbagai perusahaan pelanggan. Asumsikan data berikut mewakili informasi berkumpul untuk 16 perusahaan pada lima variabel: total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal. Menggunakan data ini untuk menghasilkan model regresi untuk memprediksi ukuran membeli oleh variabel lain. Meringkas temuan Anda dalam hal kekuatan dari model, signifikan variabel prediktor, dan setiap variabel baru yang dihasilkan oleh pengodean ulang.
Jawab :
1.       Menghitung Statistik Regresi menggunakan excel :
Koefisien Korelasi sebesar 0,773 (R Square) menunjukan bahwa variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal memiliki hubungan linier dengan arah positif.
Koefisien determinasi sebesar 0,879 (multiple R) menunjukan bahwa variable ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal memberikan pengaruh sebesar  87,9 persen terhadap variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian)  atau  dengan  kata  lain dapat dikatakan bahwa variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian) dipengaruhi oleh faktor variable ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal sebesar 87,9 persen.
Interpretasi dari r-square adjusted ialah variable y mampu dijelaskan oleh variable x sebesar 69,017 %.
Pengujian Model Regresi
Langkah 1 : Menentukan Hipotesis penelitian
Ho : β = 0 (tidak ada hubungan antara variable variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal)
Ha : β ≠ 0 (ada hubungan antara variable variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal)
Langkah 2 : Membandingkan nilai P-Value dengan  nilai α
P-value (Significance F) (0,00151542390232283) lebih kecil dari nilai α (0,05) maka gagal menolak Ho ( Ho diterima)
Membandingkan nilai F test dan F kritis
F test 3,36 < F kritis 9,35336508719246maka ho diterima
Langkah 3 : Kesimpulan
Karena ho terima maka  tidak ada hubungan antara variable variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal).
Analisis kontribusi dari variable independen
Membandingkan nilai t test dengan nilai t kritis
Df = n – (k+1) = 16 – (4+1) = 11
Untuk parameter x1
T kritis (1,796) < t test (3,1128732998356) Ho ditolak
Untuk parameter x2
T kritis (2,920) > t test (-0,155253859410615) Ho diterima
Untuk parameter x3
T kritis (2,920) > t test (0,292977036709846) Ho diterima
Untuk parameter  x4
T kritis (2,920) > t test (1,92213322117837) Ho diterima

Membuat Kesimpulan
Karena ho ditolak, maka variable x1  memberikan  pengaruh yang cukup besar terhadap variable y sedangkan variable x2, x3, x4 memberikan tidak memberikan pengaruh yang cukup besar terhadap variable y.

Dari Aplikasi Excel diatas maka kita bisa menentukan model regresinya, yaitu :
ŷ = - 1,779 + 1,374 x1 + -0,321 x2 + 0,111 x3 + 110,434 x4





Tidak ada komentar:

Posting Komentar