Model
regresi linier berganda merupakan perluasan dari model regresi linier sederhana,
dimana faktor utama yang membedakan model ini dengan model linier sederhana
adalah pada model ini terdapat lebih dari satu variabel independen. Sehingga
variabel dependen (Y) dipengaruhi oleh dua atau lebih variable independen (X1,
X2, X3, . . . Xn)
A. THE MULTIPLE REGRESSION MODEL
Secara umum, model regresi linier berganda dapat
dinyatakan dalam persamaan sebagai berikut :
![]() ![]() |
Dimana :
·
Model
, merupakan
komponen deterministic yang merupakan
model regresi dari populasi untuk nilai spesifik dari (X1, X2,
X3, . . . Xn)


·
adalah kesalahan acak (random error) yang mempresentasikan variasi yang tidak dapat diduga
diantara nilai-nilai Y untuk sekelompok nilai spesifik dari (X1, X2,
X3, . . Xn)

·
Kesalahan acak (random error) diukur dengan variansi
error (
), yang
diprediksiberdasarkan sampel yang mengukur ketepatan dari model. Dimana,
semakin kecil nilai estimasi dari variansi
error
, maka model
regresi linier berganda yang akan diestimasi juga semakin baik.


·
adalah perpotongan (intercept) garis terhadap sumbu Y

·
adalah kemiringan (slope) garis yang menggambarkan perubahan bersih Y per unit
perubahan X1

·
adalah kemiringan (slope) garis yang menggambarkan perubahan bersih Y per unit
perubahan Xn

Dalam mengestimasi parameter dari
dan
,
,
. . .
,
digunakan metode kuadrat terkecil (ordinary
least square). Metode kuadrat terkecil digunakan untuk menentukan suatu
persamaan regresi dengan meminumkan jumlah kuadrat jarak vertical antara nilai
sebenarnya dari Y dan nilai prediksi dari Y. Estimator dan diberi symbol bo dan b1, b2,
b3, … bn sehingga persamaan estimasi menjadi :




Persamaan
Regresi (metode kuadrat terkecil)
![]() ![]() |
Jika
,
maka untuk menentukan persamaan regresi dengan parameter b1 dan b2,
dapat digunakan persamaan berikut :


![]() |
![]() |
![]() |
Contoh
Dibawah ini disajikan data mengenai
pengaruh taksuran nilai tanah (X1) dan taksiran nilai perbaikan (X2)
harga jual rumah (Y)
Harga Jual Tanah
|
Taksiran Nilai Tanah
|
Taksiran nilai perbaikan
|
28
|
14
|
2
|
66
|
35
|
5
|
38
|
22
|
4
|
70
|
29
|
4
|
22
|
6
|
3
|
27
|
15
|
3
|
28
|
17
|
3
|
47
|
20
|
4
|
14
|
12
|
2
|
68
|
29
|
5
|
Buatlah model persamaan regresi berganda
untuk data diatas!
Jawab mengunakan
excel
![]() |
6

Persamaan regresi linier berganda dari
output excel tersebut adalah :

B.
Uji
Signifikansi Model Regresi
Menguji Model Keseluruhan
Dalam
regresi sederhana, uji t dari
pengurangan garis kemiringan digunakan untuk menetapkan apakah kemiringan
populasi dari garis kemiringan berbeda dari nol, yaitu apakah variabel
independen berkontribusi signifikan secara linear dalam memprediksi variabel
dependen.
Hipotesis
untuk pengujian ini adalah:
H0:
= 0

Ha:
0


Dalam
regresi berganda, uji analog digunakan dengan statistik F. Signifikan keseluruhan dari model regresi berganda diuji dengan
hipotesis sebagai berikut:
H0:


Ha:
Setidaknya terdapat satu pengurangan koefisien
0

Jika
kita gagal untuk mengolah null hypothesis,
artinya model regresi tidak memiliki
prediktabilitas yang signifikan pada variabel dependen. Penolakan hipotesis nol
mengidentifikasikan bahwa ada setidaknya satu variabel independen yang menambah
prediktabilitas secara signifikan pada y.
Nilai
F dapat dihitung dengan menggunakan rumus berikut.
F
= 

Dimana:
MS = mean square
SS
= sum of squares
df
= degree of freedom
k
= jumlah variabel independen
N
= jumlah observasi
Jika
model regresi hanya memiliki satu variabel independen yang linear, berarti itu
adalah model regresi sederhana. Maka, uji F
untuk keseluruhan model adalah sama dengan uji t untuk kemiringan populasi signifikan. Nilai F yang diperlihatkan dalam tabel regresi ANOVA berhubungan pada uji
t untuk kemiringan dalam regresi
sederhana.
F
= t2
Dalam
regresi sederhana, nilai F dan nilai t memberikan informasi yang percuma
tentang keseluruhan uji model.
Kebanyakan
peneliti yang menggunakan analisis regresi berganda akan meneliti nilai F dan nilai p pada awal proses. Jika F
tidak signifikan, maka tidak ada koefisien regresi populasi yang signifikan
berbeda dari nol, dan model pengurangan tidak memiliki prediktabilitas pada
variabel dependen.
Uji Signifikan pada Koefisien Regresi
Dalam
regresi berganda, uji signifikan individual dapat dihitung pada tiap koefisien
regresi dengan menggunakan uji t.
Tiap uji t adalah analog kepada uji t pada kemiringan untuk analisis regresi
sederhana. Hipotesis untuk menguji koefisien regresi tiap variabel independen
adalah:
H0:
= 0

Ha:
0


H0:
= 0

Ha:
0


H0:
= 0

Ha:
0


Residual,
standar kesalahan dari estimasi, dan 

C.
Residual
Residual
dari model regresi adalah perbedaan antara nilai y dan prediksi nilai
.


Residual
untuk model regresi berganda dipecahkan untuk menghitung dengan cara yang sama
dengan pengurangan sederhana. Pertama-tama, menentukan nilai
yang dapat ditentukan dengan memasukkan nilai
untuk setiap variabel independen untuk suatu set pengamatan ke dalam persamaan
regresi berganda. Kemudian, nilai dari
dihitung untuk setiap set pengamatan.


SSE dan Standar Kesalahan dari Estimasi
Salah
satu sifat dari model regresi adalah bahwa jumlah residual berjumlah nol. Sifat
yang dimiliki ini akan menghalangi kemungkinan dari menghitung rata-rata
residual sebagai suatu ukuran tunggal dari kesalahan. Dalam usahanya untuk
menghitung statistik tunggal yang menggambarkan kesalahan dalam analisis
regresi, sifat jumlah nol dapat diatasi dengan cara memangkatkan residual dan
kemudian menjumlahkan kuadrat. Seperti dalam halnya pemberlakuan sum of squares of error (SSE).
Rumus
untuk mengitung SSE untuk regresi berganda sama seperti regresi sederhana,
yaitu: 

SSE
juga dapat diperoleh langsung dari regresi berganda dengan cara menyeleksi sum of squares (SS) yang tertulis
disebelah error.
SSE
telah membatasi penggunaan dalam pengukuran kesalahan. Bagaimanapun juga, SSE
merupakan alat yang digunakan untuk menghitung pengukuran yang lebih berguna. Salah
satu kegunaannya adalah untuk menghitung standar kesalahan dalam estimasi (
),
yang pada dasarnya merupakan standar deviasi dari residual untuk model regresi.

Standar
kesalahan dari estimasi dapat dihitung dari SSE dengan degrees of freedom dari
kesalahan untuk model dan mengambil hasil akar.
Rumus:


Dimana:
n : jumlah penelitian
k : jumlah variabel independen
Koefisien dari Penentuan Berganda (
)

Koefisien
dari penentuan berganda (
)
sejalan dengan koefisien penentuan (
).
Hal ini menggambarkan proporsi variasi dari variabel dipenden, y dihitung
dengan variabel independen dalam model regresi.
Sama seperti dengan
,
jarak dari nilai yang mungkin untuk
adalah dari 0 sampai 1.
dari nol menunjukkan tidak ada hubungan antara
variabel prediksi didalam model dan y.
dari
satu menunjukkan bahwa keseluruhan dari variabilitas y telah dihitung. Tentu
saja hal ini diinginkan agar
menjadi
tinggi, menunjukkan kuatnya memprediksi model regresi. Koefisien dari penentuan
berganda dapat dihitung dengan rumus:









Penambahan
variabel independen ditambahkan untuk model regresi, nilai dari
tidak bisa dikurang, dan dalam hampir setiap
kasus
akan
meningkat.


Rumus
untuk menentuka
:



Nilai
dari
untuk suatu set penelitian akan bertahan
seperti variabel indepenen untuk dimasukkan kedalam analisis regresi
dikarenakan
merupakan sum
of squares untuk variabel dipenden.


Bagaimanapun
juga, terkadang variabel independen tambahan akan menambahkan informasi yang
tidak signifikan untuk model regresi, oleh karena itu,
memiliki
kemungkinan untuk meningkatkan angka. Ahli statistik telah mengembangkan
yang disesuaikan untuk mempertimbangkan
informasi tambahan yang dimiliki oleh setiap variabel independen baru yang
dibawa untuk model regresi dan mengubah derajat dari kebebasan regresi.
Sekarang banyak paket komputer statistik
standar yang dapat menghitung dan melaporkan
yang disesuaikan sebagai bagian dari output. Rumus untuk mengitung
yang disesuaikan adalah





D. Studi Kasus
STARBUCKS MEMPERKENALKAN KARTU DEBIT
Starbucks adalah kisah restoran
sukses besar. Awal dengan rumah kopi pertama di tahun 1971, Starbucks telah
berkembang lebih dari 11.000 lokasi di AS. Membuka nya internasional pertama stopkontak
pada pertengahan tahun 1990, Starbucks sekarang beroperasi di lebih dari 43
negara (1800 rumah kopi) di luar Utara Amerika. Selain menjual minuman,
kue-kue, permen, dan aksesoris terkait kopi dan peralatan di gerai ritel, Starbucks
juga pembelian dan daging panggang biji kopi berkualitas tinggi di beberapa
lokasi. Tujuan perusahaan adalah untuk menjadi merek paling diakui dan
dihormati di dunia. Starbucks mempertahankan orientasi lingkungan yang kuat dan
berkomitmen untuk mengambil posisi kepemimpinan lingkungan. Sebagai tambahan, perusahaan
telah memenangkan penghargaan untuk tanggung jawab sosial perusahaan melalui
program pembangunan masyarakat, komitmen yang kuat ke asal-usulnya (produsen
kopi, keluarga, masyarakat), dan Starbucks Foundation, yang didedikasikan untuk
menciptakan harapan, penemuan, dan kesempatan dalam masyarakat di mana Starbucks
berada.
Pada bulan November 2001,
Starbucks meluncurkan Kartu prabayar (debit) Starbucks. Kartu, yang memegang
antara $ 5 dan $ 500, dapat digunakan di hampir semua lokasi Starbucks. Kartu
itu begitu populer ketika pertama kali dirilis bahwa banyak toko kehabisan.
Pada pertengahan tahun 2002,
Starbucks telah diaktifkan lebih dari 5 juta kartu ini. Starbucks Card telah
melampaui $ 2500000000 mark total aktivasi dan isi ulang sejak diperkenalkan. Sebagai
pelanggan "reload" kartu, tampaknya mereka menempatkan lebih banyak
uang pada mereka dari nilai awal kartu. Starbucks telah pergi untuk
mempromosikan Kartu Starbucks mereka sebagai alat pemasaran yang fleksibel yang
dapat digunakan oleh individu sebagai karunia terima kasih dan penghargaan
untuk persahabatan atau layanan dan dapat digunakan oleh perusahaan untuk
menghargai pelanggan setia dan sebagai insentif untuk karyawan.
Diskusi
1. Starbucks menikmati kesuksesan besar dengan kartu debit , yang mereka jual sebesar $ 5 sampai $ 500 . Misalkan manajemen Starbucks ingin mempelajari alasan mengapa beberapa orang membeli kartu debit dengan jumlah prabayar lebih tinggi daripada lainnya orang-orang. Misalkan sebuah studi dari 25 pembeli kartu prabayar yang dipilih secara acak diambil . Responden ditanya jumlah kartu prabayar , usia pelanggan , nomor hari per bulan nasabah melakukan pembelian di Starbucks , jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan . Data ikuti . Menggunakan data ini , mengembangkan model regresi untuk mempelajari seberapa baik jumlah kartu prabayar dapat diprediksi oleh variabel lain dan yang variabel tampaknya lebih menjanjikan dalam melakukan prediksi . apa implikasi penjualan mungkin terlihat dari analisis ini?

2. Pemasaran misalkan ingin dapat profil sering pengunjung ke toko Starbucks. Menggunakan data yang sama ditetapkan sudah tersedia, mengembangkan model regresi berganda untuk memprediksi Hari per bulan di Starbucks oleh Umur, Pendapatan, dan Nomor cangkir kopi per hari. Seberapa kuat adalah model? Yang variabel independen tertentu tampaknya memiliki lebih banyak janji dalam memprediksi berapa hari per bulan pelanggan mengunjungi Starbucks? implikasi pemasaran apa yang mungkin terbukti dari analisis ini?
3. Selama dekade terakhir atau lebih, Starbucks telah berkembang cukup pesat. Ketika mereka menambahkan toko dan meningkatkan jumlah minuman, pendapatan penjualan mereka meningkat. Dalam merefleksikan tentang ini pertumbuhan, berpikir tentang beberapa variabel lain yang mungkin terkait dengan peningkatan Starbucks pendapatan penjualan. Beberapa data selama tujuh tahun terakhir pada jumlah Starbucks toko (seluruh dunia), perkiraan pendapatan penjualan (dalam $ juta), jumlah minuman yang berbeda yang dijual, dan rata-rata mingguan pendapatan pekerja produksi AS yang diberikan di sini. Angka merupakan perkiraan. Mengembangkan regresi berganda Model untuk memprediksi pendapatan penjualan dengan jumlah minuman yang dijual, jumlah toko, dan pendapatan rata-rata mingguan. Bagaimana model kuat? Apa prediksi kunci, jika ada? Bagaimana mungkin analisis ini membantu manajemen Starbucks mencoba untuk menentukan apa yang mendorong pendapatan penjualan?

Jawab
:
1.
dan
2. Menghitung regresi statistik menggunakan excel


Koefisien Korelasi sebesar 0,755 (R Square)
menunjukan bahwa variable jumlah kartu prabayar, usia pelanggan, nomor hari per
bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman
per hari , dan pendapatan pelanggan memiliki hubungan linier dengan arah
positif.
Koefisien determinasi sebesar 0,869 (multiple R) menunjukan
bahwa variable usia pelanggan, nomor hari per
bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman
per hari , dan pendapatan pelanggan memberikan pengaruh
sebesar 86,9 persen terhadap variable jumlah kartu
prabayar atau dengan kata lain dapat dikatakan
bahwa variable jumlah kartu prabayar
dipengaruhi oleh usia pelanggan, nomor hari per
bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman
per hari , dan pendapatan pelanggan sebesar 86,9 persen
Interpretasi dari r-square adjusted ialah variable y
mampu dijelaskan oleh variable x sebesar 70,56 %.

Pengujian Model Regresi
Langkah
1 : Menentukan Hipotesis penelitian
Ho
: β = 0 ( tidak ada hubungan antara variable jumlah kartu prabayar, usia
pelanggan, nomor hari per bulan nasabah melakukan pembelian di Starbucks,
jumlah cangkir kopi pelanggan minuman per hari , dan pendapatan pelanggan)
Ha
: β ≠ 0 (ada hubungan antara variable jumlah kartu prabayar, usia pelanggan,
nomor hari per bulan nasabah melakukan pembelian di Starbucks, jumlah cangkir
kopi pelanggan minuman per hari , dan pendapatan pelanggan)
Langkah
2 : Membandingkan nilai P-Value
dengan nilai α
P-value
(Significance F) (6,75799281711087E-06) lebih kecil dari nilai α (0,05) maka
gagal menolak Ho ( Ho diterima)
Membandingkan nilai F
test dan F kritis
F
test 2,87 < F kritis 15,378 maka ho diterima
Langkah
3 : Kesimpulan
Karena
ho terima maka tidak ada hubungan antara
variable jumlah kartu prabayar, usia pelanggan, nomor hari per bulan nasabah
melakukan pembelian di Starbucks, jumlah cangkir kopi pelanggan minuman per
hari , dan pendapatan pelanggan

Analisis
kontribusi dari variable independen
Membandingkan nilai t test dengan nilai t kritis
Df = n – (k+1) = 25 – (4+1) = 20
Untuk parameter x1
T kritis (1,725)
> t test (0,411401502266763) Ho diterima
Untuk parameter x2
T kritis (1,725)
> t test (0,807130365668201) Ho diterima
Untuk parameter x3
T kritis (1,725)
> t test (0,540321052009064) Ho diterima
Untuk parameter x4
T kritis (1,725)
< t test (6,69006207974477) Ho ditolak
Membuat
Kesimpulan
Karena ho ditolak, maka variable x1, x2, x3 tidak
memberikan pengaruh yang cukup besar terhadap variable y sedangkan variable x4
memberikan pengaruh terhadap variable y
Dari Aplikasi
Excel diatas maka kita bisa menentukan model regresinya, yaitu :
ŷ = -83,826 + 0,237 x1
+ 1,189 x2 + 1,422 x3 + 2,407 x4

3. Menghitung regresi statistik menggunakan
excel


Koefisien Korelasi sebesar 0,954 (R Square)
menunjukan bahwa variable jumlah toko Starbucks
(seluruh dunia), pendapatan penjualan (dalam $ juta), jumlah minuman yang
dijual, dan rata-rata mingguan pendapatan pekerja produksi memiliki hubungan
linier dengan arah positif.
Koefisien determinasi sebesar 0,977 (multiple R) menunjukan
bahwa variable jumlah toko Starbucks (seluruh dunia), jumlah minuman yang
dijual, dan rata-rata mingguan pendapatan pekerja produksi
memberikan pengaruh sebesar 97,7 persen terhadap variable pendapatan
penjualan (dalam $ juta) atau dengan kata lain
dapat dikatakan bahwa variable pendapatan penjualan
(dalam $ juta) dipengaruhi oleh faktor variable
jumlah toko Starbucks (seluruh dunia), jumlah
minuman yang dijual, dan rata-rata mingguan pendapatan pekerja produksi
sebesar 97,7 persen
Interpretasi dari r-square adjusted ialah variable y
mampu dijelaskan oleh variable x sebesar 90,77 %.

Pengujian Model Regresi
Langkah
1 : Menentukan Hipotesis penelitian
Ho
: β = 0 (tidak ada hubungan antara variable jumlah toko Starbucks (seluruh dunia), pendapatan
penjualan (dalam $ juta), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan
pekerja produksi)
Ha
: β ≠ 0 (ada hubungan antara variable jumlah toko Starbucks (seluruh dunia), pendapatan
penjualan (dalam $ juta), jumlah minuman yang dijual, dan rata-rata mingguan pendapatan
pekerja produksi)
Langkah
2 : Membandingkan nilai P-Value
dengan nilai α
P-value
(Significance F) (0,0165925333478546) lebih kecil dari nilai α (0,05) maka
gagal menolak Ho ( Ho diterima)
Membandingkan nilai F
test dan F kritis
F
test 9,28 < F kritis 20,6714184114723 maka ho diterima
Langkah
3 : Kesimpulan
Karena
ho terima maka tidak ada hubungan antara
variable jumlah toko Starbucks (seluruh
dunia), pendapatan penjualan (dalam $ juta), jumlah minuman yang dijual, dan
rata-rata mingguan pendapatan pekerja produksi

Analisis
kontribusi dari variable independen
Membandingkan nilai t test dengan nilai t kritis
Df = n – (k+1) = 7
– (3+1) = 3
Untuk parameter x1
T kritis (2,353)
> t test (1,76516077430032) Ho diterima
Untuk parameter x2
T kritis (2,353)
> t test (1,62950743890224) Ho diterima
Untuk parameter x3
T kritis (2,353)
> t test (-0,511755595018145) Ho diterima
Membuat
Kesimpulan
Karena ho diterima,
maka variable x1, x2, x3 tidak memberikan pengaruh yang cukup besar terhadap
variable y s
Dari Aplikasi
Excel diatas maka kita bisa menentukan model regresinya, yaitu :
ŷ = -526,836 + 0,325 x1
+ 68,655 x2 + -0,811 x3

E. MODEL NONLINEAR: TRANSFORMASI MATEMATIKA
Model
regresi yang disajikan sejauh didasarkan pada model regresi linear umum, yang
memiliki bentuk
Ῠ= βo +
β₁X₁ + β₂X₂ + β₃X₃……. βnXn + ε
Dimana:
ε =
kesalahan acak atau random error
βo = perpotongan atauinterceptgaris terhadap sumbu Y
β₁ = kemiringan atau
slope garis yang menggambarkan perubahan bersih Y perunit perubahan X1
βn = kemiringan atau slope garis yang menggambarkan perubahan
bersih Y perunit perubahan Xn
Dalam
model linear umum ini, parameternya linear.
Bagaimanapun Ini tidak berarti bahwa variabel dependen, y, yang tentu linear berhubungan dengan variabel prediktor. Pencar plot kadang-kadang mengungkapkan hubungan lengkung antara x dan y. Beberapa permukaan respon regresi tidak terbatas pada permukaan linear dan mungkin saja berbentuk lengkung.
Bagaimanapun Ini tidak berarti bahwa variabel dependen, y, yang tentu linear berhubungan dengan variabel prediktor. Pencar plot kadang-kadang mengungkapkan hubungan lengkung antara x dan y. Beberapa permukaan respon regresi tidak terbatas pada permukaan linear dan mungkin saja berbentuk lengkung.
Untuk
saat ini, variabel, xi, telah mewakili prediktor yang berbeda. Sebagai contoh,
sebuah situs model pemasaran dapat dikembangkan di mana lokasi penjualannya
terletak, sebagai variabel respon, diprediksi oleh kepadatan penduduk, jumlah
pesaing, ukuran toko, dan jumlah tenaga penjualan. model seperti itu bisa
mengambil bentuk:

Model regresi ini memiliki empat
variabel xi, yang masing-masing mewakili berbeda
prediktor. Model linear umum juga berlaku untuk situasi di mana beberapa xi mewakili recoded data dari variabel prediktor yang sudah diwakili dalam model dengan variabel independen lain. Dalam beberapa model, xi merupakan variabel yang telah mengalami transformasi matematika untuk memungkinkan model untuk mengikuti bentuk model linier umum.
prediktor. Model linear umum juga berlaku untuk situasi di mana beberapa xi mewakili recoded data dari variabel prediktor yang sudah diwakili dalam model dengan variabel independen lain. Dalam beberapa model, xi merupakan variabel yang telah mengalami transformasi matematika untuk memungkinkan model untuk mengikuti bentuk model linier umum.
Dalam bagian ini dari bab ini, kita
membahas beberapa model-model lainnya, termasuk model polinomial regresi, model
regresi dengan interaksi, dan model dengan variabel berubah.
1.
Regresi
Polinomial
Model
regresi di mana kekuasaan tertinggi dari setiap variabel prediktor adalah 1 dan
di mana tidak ada interaksi hal-lintas produk (xi xj). Model umum untuk regresi
sederhana adalah:

Jika
variabel independen kedua ditambahkan, model ini disebut sebagai model orde
pertama dengan dua variabel independen dan muncul sebagai:

Model
regresi polinomial adalah model regresi yang kedua atau model tingkat tinggi.
Mereka berisi kuadrat, potong dadu, atau kekuatan yang lebih tinggi dari
variabel prediktor (s) dan mengandung permukaan respon yang lengkung. Namun,
mereka masih kasus khusus dari model linear umum yang diberikan dalam rumus
14.1.
Pertimbangkan
model regresi dengan satu variabel independen mana model termasuk prediktor
kedua, yang merupakan variabel bebas kuadrat. Model seperti ini disebut sebagai
model orde kedua dengan satu variabel independen karena kekuasaan tertinggi di
antara prediktor adalah 2, namun masih ada hanya satu variabel independen. Model
ini mengambil bentuk berikut:

Model
ini dapat digunakan untuk mengeksplorasi kemungkinan fit dari model kuadrat
dalam memprediksi Model variable. Aquadratic tergantung adalah model regresi
berganda dimana prediktor adalah variabel dan kuadrat variabel. x2 dari model
linear umum sama dengan x2 1 maka
menjadi


Analisis
regresi berganda mengasumsikan koefisien regresi linear dan
regresi konstan, tetapi belum tentu hubungan linear dari nilai-nilai variabel independen (x). Oleh karena itu, peneliti sering dapat mencapai regresi lengkung dengan pengodean ulang data sebelum analisis regresi berganda dicoba.
regresi konstan, tetapi belum tentu hubungan linear dari nilai-nilai variabel independen (x). Oleh karena itu, peneliti sering dapat mencapai regresi lengkung dengan pengodean ulang data sebelum analisis regresi berganda dicoba.
Sebagai
contoh, mempertimbangkan data yang diberikan dalam Tabel 14.1. yang telah
dipindahkan dalam excel Tabel ini berisi volume penjualan (dalam $ juta) untuk
13 perusahaan manufaktur bersama dengan jumlah perwakilan produsen yang terkait
dengan masing-masing perusahaan. Sebuah analisis regresi sederhana untuk
memprediksi penjualan dengan jumlah perwakilan produsen hasil dalam output
Excel pada Gambar 14.1.

Hasilnya
dalam formulasi excel adalah:

Output
regresi ini menunjukkan model regresi dengan r 2 dari 87.0%, kesalahan standar
estimasi sama dengan 51,10, tes F keseluruhan signifikan untuk model, dan rasio
t signifikan untuk jumlah prediktor perwakilan produsen.
Gambar
14.2 (a) adalah plot pencar untuk data pada Tabel 14.1. Perhatikan bahwa plot
jumlah perwakilan dan penjualan bukan merupakan garis lurus dan merupakan
indikasi bahwa hubungan antara dua variabel mungkin lengkung. Untuk mengeksplorasi
kemungkinan bahwa hubungan kuadrat mungkin ada di antara penjualan dan jumlah
perwakilan, peneliti bisnis menciptakan variabel prediktor kedua, (jumlah
perwakilan produsen) 2, untuk digunakan dalam analisis regresi untuk
memprediksi penjualan bersama dengan sejumlah perwakilan produsen, seperti yang
ditunjukkan pada Tabel 14.2. Dengan demikian, variabel dapat dibuat untuk
mengeksplorasi orde kedua hubungan parabola dengan mengkuadratkan data dari
variabel independen dari model linear dan masuk ke dalam analisis. Gambar 14.2
(b) adalah plot pencar penjualan dengan (jumlah repetisi pabrikan). Perhatikan
bahwa grafik ini, dengan istilah kuadrat, lebih dekat mendekati garis lurus
daripada grafik pada Gambar 14.2 (a). Dengan pengodean ulang variabel prediktor,
peneliti menciptakan fit regresi yang berpotensi lebih baik.
Dengan
data ini, model regresi berganda dapat dikembangkan. Gambar 14.3 menunjukkan
output Excel untuk analisis regresi untuk memprediksi penjualan dengan jumlah
perwakilan produsen dan (jumlah perwakilan produsen).
Memeriksa
output pada Gambar 14.3 dan membandingkannya dengan output pada Gambar 14.1
untuk model regresi sederhana. R2 untuk model ini adalah 97,3%, yang merupakan
kenaikan dari r 2 dari 87,0% untuk model prediksi linear tunggal. Standard
error dari estimasi untuk model ini adalah 24,59, yang jauh lebih rendah dari
51,10 nilai yang diperoleh dari model regresi sederhana. Ingat, angka penjualan
$ juta. Model kuadrat mengurangi estimasi standar error dengan 26,51 ($
1.000.000), atau $ 26.510.000. Tampaknya bahwa model kuadrat adalah model yang
lebih baik untuk memprediksi penjualan.
Pemeriksaan
t statistik untuk jangka kuadrat dan probabilitas yang terkait di
Gambar 14.3 menunjukkan bahwa secara statistik signifikan pada ᾀ = 0,001 (t = 6,12 dengan probabilitas 0,0001). Jika t statistik ini tidak signifikan, peneliti akan paling mungkin menghentikan istilah kuadrat dan kembali ke model orde pertama (model regresi sederhana).
Gambar 14.3 menunjukkan bahwa secara statistik signifikan pada ᾀ = 0,001 (t = 6,12 dengan probabilitas 0,0001). Jika t statistik ini tidak signifikan, peneliti akan paling mungkin menghentikan istilah kuadrat dan kembali ke model orde pertama (model regresi sederhana).
Secara
teori, model ketiga dan tingkat tinggi dapat dieksplorasi. Secara umum, bisnis
peneliti cenderung memanfaatkan model pertama dan regresi orde kedua lebih dari model higherorder. Ingat bahwa analisis regresi yang paling digunakan dalam bisnis untuk membantu pengambilan keputusan. model yang lebih tinggi-daya (ketiga, keempat, dll) menjadi sulit untuk menafsirkan dan sulit untuk menjelaskan kepada para pengambil keputusan. Selain itu, peneliti bisnis biasanya mencari tren dan arah umum. Semakin tinggi urutan pemodelan regresi, model yang lebih cenderung mengikuti fluktuasi teratur daripada arah yang bermakna.
peneliti cenderung memanfaatkan model pertama dan regresi orde kedua lebih dari model higherorder. Ingat bahwa analisis regresi yang paling digunakan dalam bisnis untuk membantu pengambilan keputusan. model yang lebih tinggi-daya (ketiga, keempat, dll) menjadi sulit untuk menafsirkan dan sulit untuk menjelaskan kepada para pengambil keputusan. Selain itu, peneliti bisnis biasanya mencari tren dan arah umum. Semakin tinggi urutan pemodelan regresi, model yang lebih cenderung mengikuti fluktuasi teratur daripada arah yang bermakna.

Hasilnya
setelah melalui proses di Ms.Excel adalah:

2.
Transformasi
dari Ladder Tukey
Seperti
hanya ditunjukkan dengan contoh manufaktur, pengodean ulang data dapat menjadi
alat yang berguna dalam meningkatkan model regresi fit. Banyak cara lain data
recoding dapat dieksplorasi dalam proses ini. John W. Tukey menyajikan
"tangga ekspresi" yang dapat dieksplorasi untuk meluruskan sebidang x
dan y, sehingga menawarkan potensi peningkatan prediktabilitas model regresi.
Tangga transformasi Tukey memberikan ekspresi berikut untuk kedua x dan y.


tangga
ini menunjukkan cara-cara potensial pengguna recode data. Tukey menterbitkan
pendekatan empat kuadran untuk menentukan ekspresi tangga yang lebih tepat
untuk situasi tertentu. Pendekatan ini didasarkan pada bentuk plot pencar x dan
y. Gambar 14.4 menunjukkan empat kuadran dan ekspresi pengodean ulang terkait.
Sebagai contoh, jika plot pencar x dan y menunjukkan bentuk seperti yang
ditunjukkan pada kuadran kiri atas, recoding harus bergerak "menuruni
tangga" untuk variabel x terhadap

atau
"menaiki tangga" untuk y variabel terhadap

atau
"menuruni tangga" untuk y variabel terhadap

Dalam
contoh manufaktur, grafik pada Gambar 14.2 (a) berbentuk seperti kurva di
kuadran kanan bawah dari pendekatan maka empat kuadran Tukey menunjukkan bahwa peneliti bisnis bergerak "naik tangga" pada x seperti yang dilakukan dengan menggunakan istilah kuadrat. Peneliti bisa menjelajahi pilihan lain seperti melanjutkan menaiki tangga dari x atau turun tangga y. tangga Tukey adalah kontinum dan meninggalkan terbuka kemungkinan recoding lainnya antara ekspresi. Misalnya, antara x2 dan x3 banyak kekuatan yang mungkin dari x yang bisa dieksplorasi, seperti X2.1, x2.5, atau x2.86.
kuadran kanan bawah dari pendekatan maka empat kuadran Tukey menunjukkan bahwa peneliti bisnis bergerak "naik tangga" pada x seperti yang dilakukan dengan menggunakan istilah kuadrat. Peneliti bisa menjelajahi pilihan lain seperti melanjutkan menaiki tangga dari x atau turun tangga y. tangga Tukey adalah kontinum dan meninggalkan terbuka kemungkinan recoding lainnya antara ekspresi. Misalnya, antara x2 dan x3 banyak kekuatan yang mungkin dari x yang bisa dieksplorasi, seperti X2.1, x2.5, atau x2.86.
3.
Model
Regresi dengan Interaksi
Model
regresi dengan Interaksi seringkali ketika dua variabel independen yang berbeda
yang digunakan dalam analisis regresi, interaksi terjadi antara dua variabel.
Interaksi ini telah dibahas dalam Bab 11 dalam analisis dua arah varians, di
mana satu variabel akan bertindak berbeda selama rentang tertentu nilai untuk
variabel kedua daripada yang dilakukannya selama rentang lain nilai untuk
variabel kedua. Misalnya, di pabrik, suhu dan kelembaban mungkin berinteraksi
sedemikian rupa untuk memberikan efek pada kekerasan bahan baku. Kelembaban
udara dapat mempengaruhi bahan baku berbeda pada temperatur yang berbeda.
Dalam
analisis regresi, interaksi dapat diperiksa sebagai variabel independen yang
terpisah. Variabel interaksi prediktor dapat dirancang dengan mengalikan nilai
data satu variabel dengan nilai-nilai dari variabel lain, sehingga menciptakan
sebuah variabel baru. Sebuah model yang mencakup variabel interaksi


Analisis
untuk mengeksplorasi efek interaksi dengan memasukkan istilah interaksi dalam
persamaan.

persamaan
sesuai dengan bentuk model linier umum

Dimana
x3 = x1x2. Setiap pengamatan individu x3 diperoleh melalui rekaman
Proses dengan mengalikan pengamatan terkait dari x1 dan x2.
Proses dengan mengalikan pengamatan terkait dari x1 dan x2.
Gambar
14.6 (a) adalah permukaan respon untuk model pertama regresi disajikan pada
Gambar 14.5 (model tanpa interaksi). Ketika Anda mengamati pesawat respon
dengan saham 3 sebagai titik acuan, Anda melihat pesawat bergerak ke atas
dengan meningkatnya nilai saham 1 sebagai pesawat bergerak menjauh dari Anda
terhadap nilai-nilai yang lebih kecil dari 2. Sekarang saham pada Gambar 14.6
(b), permukaan respon untuk model regresi kedua disajikan pada Gambar 14.5
(model dengan interaksi). Perhatikan bagaimana pesawat respon dipelintir,
dengan perubahan kemiringan sebagai bergerak bersama saham 2. Pola ini
disebabkan oleh efek interaksi saham 2 harga dan stok 3 harga.
Sebuah
penampang dari pesawat diambil dari kiri ke kanan pada setiap pengait harga
saham 2 menghasilkan garis yang mencoba untuk memprediksi harga saham 3 dari
harga saham 1. Ketika Anda bergerak kembali melalui harga yang berbeda dari
saham 2, lereng itu menunjukkan perubahan garis, menunjukkan bahwa hubungan
antara saham 1 dan stok 3 bervariasi sesuai stock 2.
Seorang
peneliti juga bisa mengembangkan model menggunakan dua variabel bebas dengan
mereka kotak dan interaksi. Model seperti itu akan menjadi model orde kedua
dengan dua variabel independen. model akan terlihat seperti ini.

4.
Model
Transformasi
Untuk
saat ini dalam memeriksa model polinomial dan interaksi, telah fokus di
pengodean ulang nilai-nilai x variabel. Beberapa situasi regresi berganda
mengharuskan variabel dependen, y, akan pengkodean ulang. Untuk menguji
hubungan yang berbeda antara x dan y, analisis empat kuadran Tukey dan tangga
transformasi dapat digunakan untuk mengeksplorasi cara untuk pengkodean ulang x
atau y dalam upaya untuk membangun model regresi dengan lebih prediktabilitas.
Termasuk di tangga yang seperti transformasi y sebagai log y dan 1 / y.
Misalkan
data berikut mewakili penjualan tahunan dan pengeluaran iklan tahunan oleh
tujuh perusahaan.

Setelah
melalui proses komputerisasi hasilnya adalah:

Namun,apabila
menggunakan cara manual salah satu model matematika yang merupakan penguji yang
baik bagi data ini adalah model eksponensial dalam bentuk

Model
ini dapat diubah (dengan mengambil log dari setiap sisi) sehingga dalam bentuk
dari persamaan linear umum.

Model
berubah ini membutuhkan recoding dari data y melalui penggunaan logaritma.
Perhatikan bahwa x tidak di kode ulang tapi tetap konstan regresinya dan
koefisien dalam skala logaritmik. Jika kita membiarkan
eksponensial model dalam bentuk model linier
umum.


Proses
dimulai dengan mengambil log dari nilai-nilai y. Data yang digunakan untuk membangun
model regresi dan output regresi Excel untuk data ini mengikuti.

Sebuah
model regresi sederhana (tanpa pengodean ulang log dari variabel y)
menghasilkan R2 sebesar 87%, sedangkan model eksponensial R2 adalah 98%. T
statistik untuk iklan adalah 15,82 dengan p-nilai 0,00001834 dalam model
eksponensial dan 5.77 dengan p-nilai 0,00219 dalam model regresi sederhana.
Dengan demikian model eksponensial memberikan lebih cocok daripada model
regresi sederhana. Pemeriksaan (x2, y) dan (x3, y) model mengungkapkan R2 dari
0,930 dan 0,969, masing-masing, yang cukup tinggi tetapi masih tidak sebagus R2
yang dihasilkan oleh model eksponensial (output untuk model ini adalah tidak
ditampilkan di sini). Persamaan yang dihasilkan dari model regresi eksponensial
adalah

Dalam
menggunakan persamaan regresi ini untuk menentukan nilai prediksi dari y untuk
x, ingat yang dihasilkan diperkirakan y nilai dalam bentuk logaritmik dan
antilog dari yang diprediksi y harus diambil untuk mendapatkan nilai y yang
diprediksi dalam satuan baku. Misalnya, untuk mendapatkannya diprediksi nilai y
(penjualan) untuk seorang tokoh periklanan 2.0 ($ juta), pengganti x = 2.0 ke
dalam persamaan regresi.

Log
dari penjualan 3,8505. Mengambil antilog dari 3,8505 hasil dalam penjualan
diprediksi di unit baku.

Dengan
demikian, model regresi eksponensial memprediksi bahwa $ 2,0 juta dari iklan
akan menghasilkan $ 7,087.61 juta penjualan.
Cara
lain dapat digunakan untuk mengubah model matematika sehingga mereka dapat
diperlakukan seperti model linear umum. Salah satu contoh adalah model terbalik
seperti

Model
seperti itu dapat dimanipulasi aljabar ke dalam bentuk

Mensubstitusi
ke dalam persamaan ini menghasilkan persamaan
yang dalam bentuk
model linear umum

model linear umum

Untuk
menggunakan ini model "terbalik", recode nilai data untuk y dengan
menggunakan 1 y. Regresi Analisis dilakukan pada data 1 y, x1, dan x2. Untuk
mendapatkan nilai prediksi dari y dari model ini, masukkan nilai baku dari x1
dan x2. nilai prediksi yang dihasilkan dari y dari persamaan regresi akan
menjadi kebalikan dari yang sebenarnya diprediksi nilai y.
DEMONSTRASI PERMASALAHAN
Dalam
industri kedirgantaraan dan pertahanan, beberapa perkiraan biaya memprediksi
biaya proyek ruang baru dengan menggunakan model matematis yang
menerima sesuatu bentuk
biaya proyek ruang baru dengan menggunakan model matematis yang
menerima sesuatu bentuk

Estimator
biaya ini sering menggunakan berat benda yang dikirim ke ruang angkasa sebagai
prediktor (x) dan biaya objek sebagai variabel dependen (y). Cukup sering β
ternyata menjadi nilai antara 0 dan 1, sehingga nilai prediksi y menyamai
beberapa akar x.
beberapa akar x.
Gunakan
data biaya sampel yang diberikan di sini untuk mengembangkan model biaya
regresi di Formulir hanya ditampilkan untuk menentukan persamaan untuk nilai
prediksi y. Gunakan ini persamaan regresi untuk memprediksi nilai y untuk x =
3.000

Penyelesaian
persamaan
persamaan

tidak
dalam bentuk model linear umum, tetapi dapat diubah dengan menggunakan
logaritma:
logaritma:

yang
mengambil bentuk linear umum

Persamaan
ini membutuhkan baik x dan y disimpan dengan mengambil logaritma dari
masing-masing

Menggunakan
data ini, komputer menghasilkan konstanta regresi berikut dan koefisien:
bo
= -1.25292 b1 = 0.49606
log
y = -1.25292 + 0.49606logX
bila
X = 3000, log X = 3.47712
log y = -1.25292 + 0.49606 (3.47712) = 0.47194
lalu,
y = antilog(log y) = antilog
(0.47194) = 2.9644
Maka,
nilai prediksi dari y adalah $ 2964400000 untuk berat x = 3000 ton.
Mengambil antilog dari b0 = -1,25292 menghasilkan 0,055857. Dari ini dan b1 = 0,49606, model dapat ditulis dalam bentuk aslinya:
Mengambil antilog dari b0 = -1,25292 menghasilkan 0,055857. Dari ini dan b1 = 0,49606, model dapat ditulis dalam bentuk aslinya:

Dengan
mensubstitusi X + 3000 ke dalam rumus ini juga menghasilkan $ 2964500000 untuk
nilai prediksi y.
F.
Indicator
(Dummy) Variables
Beberapa
variabel disebut sebagai variabel kualitatif. Variabel kualitatif menghasilkan
informasi nominal atau ordinal, yang lebih digunakan untuk mengkategorikan
sesuatu. Variabel tersebut memiliki peran dalam regresi berganda dan disebut
sebagai indikator, atau variabel dummy. Pada bagian ini, kita akan meneliti
peran indikator atau dummy sebagai variabel prediktor atau variabel independen
dalam analisis regresi ganda. Variabel indikator muncul dalam banyak cara dalam
penelitian bisnis. Kuesioner atau wawancara pribadi pertanyaan demografi adalah
kandidat utama karena mereka cenderung menghasilkan langkah-langkah kualitatif
pada item seperti jenis kelamin, wilayah geografis, pekerjaan, status
perkawinan, tingkat pendidikan, kelas ekonomi, agama, metode transportasi, atau
jenis broker.
Kebanyakan
peneliti memberikan kode variabel indikator dengan menggunakan 0 atau 1.
Sebagai contoh, dalam penelitian pusat perbelanjaan, mal yang terletak di tepi
Danau Erie diberi kode 1, dan semua mal lain kemudian akan diberi kode 0.
Penentuan kode 0 atau 1 adalah bebas dengan maksud tempat untuk kategori saja,
bukan berarti data dengan kode 0 lebih baik daripada data dengan kode 1. Untuk
alasan tersebut, coding ini disebut sebagai "dummy" coding, dimana
nomor mewakili kategori dengan memegang tempat dan tidak sebagai pengukur.
Banyak indikator atau dummy variabel dikotomis, seperti laki-laki / perempuan,
salad bar / tidak ada salad bar, bekerja / tidak bekerja, dan sewa / rumah
sendiri.
Jika
variabel indikator memiliki kategori c, maka variabel dummy dihitung dengan c -
1 dan dimasukkan ke dalam analisis regresi untuk memasukkan variabel indikator
dalam regresi ganda. Misalkan seorang peneliti menggunakan analisis regresi
berganda untuk memprediksi biaya melakukan bisnis dan lokasi geografis dari
kantor adalah prediktor potensial. Jumlah c = 4 untuk pertanyaan ini, maka tiga
variabel dummy dimasukkan ke dalam analisis.



Berdasarkan tabel diatas, maka persamaan garis untuk
contoh ini adalah y = 732,06 + 11,12 (umur) + 458,7 (jenis kelamin)
Pengujian
pada rasio t menyatakan bahwa variabel dummy "jenis kelamin" memiliki
koefisien regresi yang signifikan di = 0,001 (t = 8.58, p = 1,82). Keseluruhan
model adalah signifikan pada = 0,001 (F = 48,54, p = 0,000). Standard error
dari estimasi, se = 96,79157833, menunjukkan bahwa sekitar 68% dari kesalahan
prediksi berada dalam $ 96,79. R2 relatif tinggi di 89,0%, dan
disesuaikan R2 adalah 87,2%. Nilai T untuk jenis kelamin menunjukkan
bahwa itu adalah prediktor signifikan dari gaji bulanan dalam model ini. Ketika
jenis kelamin = 1 (laki-laki), rumus regresi menjadi y = 1190,76 + 11,12 (umur)
dan kertika jenis kelamin = 0 (perempuan), rumus regresi menjadi y = 732,06 +
11,12 (umur). Perbedaan intercept dari kedua persamaan adalah 0,459; yang
merupakan nilai koefisien regresi untuk jenis kelamin. Intercept ini
menunjukkan signifikansi bahwa rata-rata pria mendapatkan $ 459 per bulan lebih
dari perempuan untuk populasi ini.
G.
Model
Building : Search Procedures
Search procedures adalah proses dimana lebih dari satu
model regresi berganda dikembangkan untuk database yang diberikan, dan model
dibandingkan dan diurutkan berdasarkan kriteria yang berbeda, tergantung pada
prosedur yang diberikan.
All Possible Regression
Menghitung
semua kemungkinan model regresi linier berganda dari data menggunakan semua
variabel. Jika sekumpulan data mengandung variabel independen k, semua
kemungkinan regresi akan menentukan model
- 1 berbeda.

Stepwise Regression
Melibatkan dua
jenis proses yaitu: forward selection dan backward elimination. Teknik ini
dilakukan melalui beberapa tahapan. Pada masing-masing tahapan, kita akan
memutuskan variabel mana yang merupakan prediktor terbaik untuk dimasukkan ke
dalam model. Variabel ditentukan berdasarkan uji F, variabel ditambahkan ke
dalam model selama nilai p-valuenya kurang dari nilai kritis α (biasanya 0,15).
Kemudian variabel dengan nilai p-value lebih dari nilai kritis α akan
dihilangkan. Proses ini dilakukan terus menerus hingga tidak ada lagi variabel
yang memenuhi kriteria untuk ditambahkan atau dihilangkan.
Model dalam stepwise
regression adalah:
Y = β0 + β1X1 + β2X2 + β3X3 + …. + βnXn
Sedangkan hipotesis yang digunakan dalam stepwise regression adalah:
H0 : β1, β2,
β3 = 0
Ha : β1, β2,
β3 ≠ 0
Backward Elimination
Membuat model dengan memasukkan semua
variabel kemudian dikeluarkan satu persatu dengan melakukan pengujian terhadap
parameter–parameternya dengan menggunakan partial F test. Nilai partial F-test
(FL) terkecil dibandingkan dengan F0 tabel:
• Jika FL < F0, maka X yang bersangkutan dikeluarkan dari
model dan dilanjutkan dengan pembuatan model baru tanpa variabel tersebut
• Jika FL > F0,
maka proses dihentikan dan persamaan terakhir tersebut yang digunakan/dipilih
Forward Selection
Forward Selection merupakan salah satu metode
pemodelan (pembangunan model linier) untuk menemukan kombinasi peubah yang
“terbaik” dari suatu gugus peubah. Dalam prosedur forward selection, sekalinya
variabel masuk kedalam persamaan maka tidak bisa dihilangkan.
Selain itu, forward selection dapat berarti memasukkan
variabel bebas yang memiliki korelasi yang paling erat dengan variabel tak
bebasnya (variabel yang paling potensial untuk memiliki hubungan linier dengan
Y). Kemudian secara bertahap memasukkan variabel bebas yang potensial
berikutnya dan nanti akan terhenti sampai tidak ada lagi variabel bebas yang
potensial.
Prosedur Forward Selection
Prosedur forward selection dimulai dengan sebuah
persamaan yang terdiri dari suku konstanta, tidak terdiri dari predictor
variable. Variabel pertama yang masuk ke dalam persamaan adalah variable yang
memiliki simple correlation tertinggi dan signifikan dengan variable Y. Jika
koefisien regresi signifikan berbeda dari 0 maka tetap dipakai dalam persamaan,
dan dilakukan pencarian variabel kedua. Variabel yang masuk ke dalam persamaan
sebagai variable kedua adalah variabel yang memiliki korelasi tertinggi kedua
dan masih signifikan dengan Y. Kemudian koefisien regresi dari variabel kedua
diuji. Jika signifikan, maka dilakukan pencarian terhadap variabel ketiga
dengan cara yang sama. Prosedur dihentikan saat pemasukan variabel
terakhir tidak memiliki koefisien regresi dan tidak signifikan atau semua
variable masuk dalam persamaan. Koefisien regresi yang signifikan dari variabel
terakhir dilihat dari uji-t dari persamaan terakhir.
Langkah-Langkah Forward Selection:
1. Mulai dengan tidak ada predictor variable (model
hanya berisi konstanta)
2. Untuk semua predictor variable tidak dalam model,
pilih satu variable dengan nilai p-value terkecil dan kurang
dari taraf nyata α
3. Ulangi langkah kedua hingga tidak terdapat
predictor variable yang dapat ditambahkan ke dalam model
H.
Multikolinearitas
Satu masalah yang bisa timbul dalam analisis regresi berganda adalah multikolinearitas. Multikolinearitas adalah ketika dua atau lebih variabel independen dari regresi berganda Model sangat berkorelasi. Secara teknis, jika dua variabel independen berkorelasi, kami memiliki collinearity; ketika tiga atau lebih variabel independen berkorelasi, kita memiliki multikolinearitas. Namun, kedua istilah ini sering digunakan secara bergantian. Realitas riset bisnis adalah bahwa sebagian besar waktu beberapa korelasi antara prediktor (Variabel independen) akan hadir. Masalah multikolinearitas timbul ketika intercorrelation antara variabel prediktor tinggi. Hubungan ini menyebabkan beberapa masalah lain, terutama dalam penafsiran analisis.
1. Sulit, jika tidak mustahil, untuk menafsirkan perkiraan regresi koefisien.
2. Nilai t terlampau kecil untuk koefisien regresi dapat mengakibatkan.
3. Standar deviasi dari koefisien regresi berlebihan.
4. Tanda aljabar estimasi koefisien regresi mungkin kebalikan dari apa yang akan diharapkan untuk variabel prediktor tertentu.
Masalah multikolinieritas dapat timbul dalam analisis regresi dalam berbagai bisnis
situasi penelitian. Misalnya, kira model sedang dikembangkan untuk memprediksi gaji di suatu industri tertentu. variabel independen seperti tahun pendidikan, usia, tahun di manajemen, pengalaman pada pekerjaan, dan tahun masa jabatan dengan perusahaan mungkin dianggap sebagai prediktor. Hal ini jelas bahwa beberapa dari variabel ini berkorelasi (hampir semua ini variabel ada hubungannya dengan jumlah tahun, atau waktu) dan menghasilkan informasi yang berlebihan.
Misalkan model regresi keuangan sedang dikembangkan untuk memprediksi pasar obligasi tarif oleh variabel independen seperti Dow Jones rata-rata, tingkat suku bunga prime, GNP, produser Indeks harga, dan indeks harga konsumen. Beberapa prediktor tersebut cenderung intercorrelated.
Dalam dunia contoh produksi minyak mentah yang digunakan dalam bagian 14.3, beberapa independen variabel intercorrelated, menyebabkan potensi masalah multikolinearitas.
Tabel 14.15 memberikan korelasi dari variabel prediktor untuk contoh ini. Catatan
bahwa nilai-nilai r yang cukup tinggi (r > 0,90) untuk tingkat bahan bakar dan nuklir (0,972), tingkat bahan bakar dan batubara (0,968), dan batubara dan nuklir (0,952).
Tabel 14.15 menunjukkan bahwa tingkat bahan bakar dan produksi batubara sangat berkorelasi. menggunakan tingkat bahan bakar sebagai prediktor tunggal produksi minyak mentah menghasilkan model regresi sederhana berikut
ŷ
= 44.869 + .7838 (fuel rate)
Perhatikan bahwa estimasi koefisien regresi , 0,7838 , adalah positif , menunjukkan bahwa dengan meningkatnya tingkat bahan bakar, produksi minyak meningkat . Menggunakan batubara sebagai prediktor tunggal minyak mentah produksi menghasilkan model regresi sederhana berikut.
ŷ
= 45.072 + .0157 (coal)
Model regresi berganda dikembangkan menggunakan kedua tingkat bahan bakar dan batubara untuk memprediksi
produksi minyak mentah
ŷ
= 45.806 + .0227 (coal) - .3934 (fuel rate)

Perhatikan bahwa model regresi ini menunjukkan hubungan negatif antara tingkat bahan bakar dan produksi minyak (-.3934), yang bertentangan dengan hubungan positif yang ditunjukkan pada persamaan regresi untuk tingkat bahan bakar sebagai prediktor tunggal. Karena multikolinearitas antara batubara dan tingkat bahan bakar, dua variabel independen ini berinteraksi dalam regresi analisis dengan cara seperti untuk menghasilkan estimasi koefisien regresi yang sulit menafsirkan. Sangat hati-hati harus dilakukan sebelum menafsirkan koefisien regresi ini memperkirakan. masalah multikolinieritas juga dapat mempengaruhi nilai-nilai t yang digunakan untuk mengevaluasi koefisien regresi. Karena masalah multikolinieritas antara prediktor bisa menghasilkan terlalu tinggi dari standar deviasi dari koefisien regresi, t nilai-nilai cenderung underrepresentative ketika multikolinearitas hadir. Dalam beberapa regresi model yang mengandung multikolinieritas di mana semua nilai t yang tidak signifikan, secara keseluruhan F Nilai untuk model ini sangat signifikan. Dalam Bagian 14.1, contoh diberikan tentang bagaimana termasuk interaksi ketika signifikan memperkuat model regresi. Komputer output untuk model regresi baik dengan dan tanpa istilah interaksi ditunjukkan di Gambar 14.5. Model tanpa interaksi menghasilkan nilai F signifikan secara statistik tetapi tidak variabel prediktor signifikan. Penyelidikan lebih lanjut dari model ini mengungkapkan bahwa korelasi antara dua prediktor, x1 dan x2, adalah 0,945. korelasi yang sangat tinggi ini menunjukkan collinearity yang kuat antara dua variabel prediktor. collinearity ini dapat menjelaskan fakta bahwa model keseluruhan signifikan tetapi tidak prediktor signifikan. Hal ini juga menggarisbawahi salah satu masalah dengan multikolinearitas: nilai t terwakili. Nilai t menguji kekuatan prediksi yang diberikan lainnya variabel dalam model. Jika prediktor sangat berkorelasi dengan variabel independen lain, akan muncul untuk tidak menambahkan banyak untuk penjelasan dari y dan menghasilkan nilai t rendah. Namun, telah prediktor tidak pernah di hadapan variabel-variabel berkorelasi lainnya, prediktor yang mungkin menjelaskan proporsi yang tinggi dari variasi y. Banyak masalah yang diciptakan oleh multikolinearitas masalah interpretasi. Peneliti bisnis harus waspada dan menyadari potensi multikolinearitas dengan prediktor dalam model dan melihat hasil model dalam terang potensi tersebut.
Masalah multikolinieritas tidak sederhana untuk diatasi. Namun, beberapa metode menawarkan sebuah pendekatan untuk masalah ini. Salah satu cara adalah dengan memeriksa matriks korelasi seperti yang ada di Tabel 14.15 untuk mencari kemungkinan interkorelasi antara potensi prediktor variabel. Jika beberapa variabel yang sangat berkorelasi, peneliti dapat memilih variabel yang paling berhubungan dengan variabel dependen dan menggunakan variabel yang mewakili yang lain dalam analisis. Satu masalah dengan ide ini adalah bahwa korelasi dapat lebih kompleks daripada korelasi sederhana antara variabel. Dengan kata lain, korelasi sederhana nilai tidak selalu mengungkapkan korelasi berganda antara variabel. dalam beberapa contoh, variabel mungkin tidak tampak berkorelasi sebagai pasangan, tapi satu variabel adalah linier kombinasi dari beberapa variabel lain. Situasi ini juga merupakan contoh multikolinearitas, dan pengamatan sepintas dari matriks korelasi akan mungkin tidak mengungkapkan masalah. regresi bertahap adalah cara lain untuk mencegah masalah multikolinearitas. Proses pencarian memasuki variabel satu per satu dan membandingkan variabel baru dengan yang di larutan. Jika variabel baru dimasukkan dan nilai-nilai t pada variabel lama menjadi tidak signifikan, variabel lama putus dari solusi. Dengan cara ini, akan lebih sulit untuk masalah multikolinearitas mempengaruhi analisis regresi. Tentu saja, karena multikolinearitas, beberapa prediktor penting mungkin tidak masuk ke dalam analisis.
Teknik lain yang tersedia untuk mencoba untuk mengontrol masalah multikolinearitas . Salah satu yang disebut faktor varians inflasi , di mana analisis regresi dilakukan untuk memprediksi variabel independen dengan variabel independen lainnya . Pada kasus ini, variabel independen yang diprediksi menjadi variabel dependen . Karena proses ini dilakukan untuk setiap variabel independen , adalah mungkin untuk menentukan apakah salah satu dari variabel independen adalah fungsi dari variabel independen lain , menghasilkan bukti multikolinearitas . Dengan menggunakan hasil dari model tersebut , inflasi varians Faktor ( VIF ) dapat dihitung untuk menentukan apakah kesalahan standar dari estimasi yang meningkat :

Di manaadalah koefisien determinasi untuk salah satu model , digunakan untuk memprediksi independen variabel dengan k lainnya - 1 variabel independen. Beberapa peneliti mengikuti pedoman bahwa faktor varians inflasi lebih besar dari 10 atau
nilai lebih dari 0,90 untuk terbesar faktor varians inflasi menunjukkan masalah multikolinearitas parah . **
I.
Studi
Kasus
VIRGINIA
SEMICONDUCTOR
Virginia Semiconductor adalah produsen terkemuka perdana substrat silikon. Perusahaan, yang terletak di Fredericksburg, Virginia, didirikan pada tahun 1978 oleh Dr Thomas G. Digges dan saudaranya, Robert. Virginia Semiconductor (VSI) tumbuh dan makmur pada awal tahun 1980 dengan menjual tinggi volume wafer-profit margin rendah di mikroelektronik industri. Namun, pada tahun 1985, tanpa pemberitahuan, VSI kehilangan dua
pelanggan utama yang mewakili 65% dari bisnisnya. Kiri dengan hanya 35% dari basis penjualan, perusahaan sangat memerlukan pelanggan. Dr. Digges, CEO dari VSI, memutuskan untuk mencari pasar di mana-Nya pangsa pasar perusahaan akan kecil tapi margin laba akan tinggi karena nilai penelitian rekayasa dan keahliannya. Keputusan ini ternyata menjadi arah yang bijaksana untuk kecil, perusahaan serbaguna. VSI dikembangkan silikon wafer itu dua inci diameter, tebal 75 mikron, dan dipoles pada kedua sisi. Wafer seperti yang dibutuhkan oleh beberapa pelanggan tetapi tidak pernah diproduksi sebelumnya. Perusahaan menghasilkan sejumlah wafer ini dan menjual mereka untuk lebih dari 10 kali harga wafer konvensional.
Segera perusahaan itu membuat wafer dari 2 sampai 4 mikron tebal (sangat tipis), wafer dengan permukaan bertekstur untuk aplikasi inframerah, dan wafer dengan lubang micromachined atau bentuk dan menjualnya di pasar khusus. Itu bisa untuk memberikan produk-produk ini lebih cepat dari pesaing mampu memberikan wafer standar.
Memiliki membuat terobosan di mengganti kehilangan penjualan, Virginia Semikonduktor masih harus merampingkan operasi dan kontrol persediaan dan biaya. Tidak ada PHK terjadi, tapi rata-rata kerja-minggu turun menjadi 32 jam dan presiden mengambil pengurangan gaji 80% untuk waktu. Beban dipotong sejauh tampak mungkin. Perusahaan memiliki hampir tidak ada jangka panjang hutang dan untungnya mampu membuatnya melalui periode ini tanpa menimbulkan utang yang signifikan tambahan. Tidak adanya pembayaran utang besar bulanan memungkinkan perusahaan untuk merespon dengan cepat kebutuhan produksi baru.
Virginia Semiconductor meningkatkan kualitas produksi dengan karyawan lintas-pelatihan. Selain itu, perusahaan berpartisipasi di negara bagian upaya pembangunan ekonomi Virginia untuk menemukan pasar di Eropa, Jepang, Korea, dan Israel. ekspor, yang hanya 1% dari bisnis perusahaan pada tahun 1985, tumbuh untuk lebih dari 40%. perusahaan terus mencari pelanggan baru karena pengembangan produk. VSI memiliki distributor produk mereka di 29 negara yang berbeda. Menggarisbawahi nilai inti VSI, dinyatakan pada halaman Web perusahaan: "Seperti biasa, VSI benar-benar dapat membuat wafer silikon untuk spesifikasi apapun dan terus memasok kecil, pesanan rumit untuk dihargai
pelanggan. "
Diskusi
1. Hal ini sering berguna untuk para pengambil keputusan di sebuah perusahaan untuk menentukan faktor-faktor apa yang masuk ke dalam ukuran pelanggan. pengambil keputusan membeli. Misalkan di Virginia Semikonduktor ingin menentukan dari data masa lalu apa variabel mungkin prediktor ukuran pembelian dan mampu mengumpulkan beberapa data di berbagai perusahaan pelanggan. Asumsikan data berikut mewakili informasi berkumpul untuk 16 perusahaan pada lima variabel: total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal. Menggunakan data ini untuk menghasilkan model regresi untuk memprediksi ukuran membeli oleh variabel lain. Meringkas temuan Anda dalam hal kekuatan dari model, signifikan variabel prediktor, dan setiap variabel baru yang dihasilkan oleh pengodean ulang.


Jawab :
1.
Menghitung
Statistik Regresi menggunakan excel :


Koefisien Korelasi sebesar 0,773 (R Square) menunjukan
bahwa variable total jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran
pembelian), ukuran perusahaan membeli (Total volume penjualan), persentase dari
semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak dari
perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan
pelanggan memiliki agen pembelian pusat tunggal memiliki hubungan linier dengan
arah positif.
Koefisien determinasi sebesar 0,879 (multiple R) menunjukan
bahwa variable ukuran perusahaan membeli (Total
volume penjualan), persentase dari semua pembelian dibuat oleh perusahaan
pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor,
dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal memberikan pengaruh
sebesar 87,9
persen terhadap variable total jumlah pembelian
yang dilakukan selama periode satu tahun (Ukuran pembelian) atau dengan kata lain dapat dikatakan bahwa variable total
jumlah pembelian yang dilakukan selama periode satu tahun (Ukuran pembelian)
dipengaruhi oleh faktor variable ukuran
perusahaan membeli (Total volume penjualan), persentase dari semua pembelian dibuat
oleh perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari
Virginia Semikonduktor, dan apakah perusahaan pelanggan memiliki agen pembelian
pusat tunggal
sebesar 87,9 persen.
Interpretasi dari r-square adjusted ialah variable y
mampu dijelaskan oleh variable x sebesar 69,017
%.

Pengujian Model Regresi
Langkah
1 : Menentukan Hipotesis penelitian
Ho
: β = 0 (tidak ada hubungan antara variable variable total jumlah pembelian
yang dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan
membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh
perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor,
dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal)
Ha
: β ≠ 0 (ada hubungan antara variable variable total jumlah pembelian yang
dilakukan selama periode satu tahun (Ukuran pembelian), ukuran perusahaan
membeli (Total volume penjualan), persentase dari semua pembelian dibuat oleh
perusahaan pelanggan yang impor, jarak dari perusahaan pelanggan dari Virginia Semikonduktor,
dan apakah perusahaan pelanggan memiliki agen pembelian pusat tunggal)
Langkah
2 : Membandingkan nilai P-Value
dengan nilai α
P-value
(Significance F) (0,00151542390232283) lebih kecil dari nilai α (0,05) maka
gagal menolak Ho ( Ho diterima)
Membandingkan nilai F
test dan F kritis
F
test 3,36 < F kritis 9,35336508719246maka
ho diterima
Langkah
3 : Kesimpulan
Karena
ho terima maka tidak ada hubungan antara
variable variable total jumlah pembelian yang dilakukan selama periode satu
tahun (Ukuran pembelian), ukuran perusahaan membeli (Total volume penjualan),
persentase dari semua pembelian dibuat oleh perusahaan pelanggan yang impor, jarak
dari perusahaan pelanggan dari Virginia Semikonduktor, dan apakah perusahaan
pelanggan memiliki agen pembelian pusat tunggal).

Analisis
kontribusi dari variable independen
Membandingkan nilai t test dengan nilai t kritis
Df = n – (k+1) = 16
– (4+1) = 11
Untuk parameter x1
T kritis (1,796)
< t test (3,1128732998356)
Ho ditolak
Untuk parameter x2
T kritis (2,920) > t test (-0,155253859410615) Ho
diterima
Untuk parameter x3
T kritis (2,920) > t test (0,292977036709846) Ho
diterima
Untuk parameter x4
T kritis (2,920) > t test (1,92213322117837) Ho
diterima
Membuat
Kesimpulan
Karena ho ditolak, maka variable x1 memberikan pengaruh
yang cukup besar terhadap variable y sedangkan
variable x2, x3, x4 memberikan tidak memberikan pengaruh
yang cukup besar terhadap variable y.
Dari Aplikasi
Excel diatas maka kita bisa menentukan model regresinya, yaitu :
ŷ = - 1,779 + 1,374 x1 + -0,321 x2 + 0,111 x3 + 110,434 x4

Tidak ada komentar:
Posting Komentar