A.
Korelasi
Analisis regresi
dan korelasi didasarkan pada hubungan atau asosiasi antara dua variabel atau lebih.
Meskipun demikian, analisis regresi berbeda dengan analisis korelasi. Analisis
regresi digunakan untuk data yang berskala atau rasio, dan mengasumsikan adanya
hubungan antara dua atau lebih variabel yang bersifat kausalitas. Kedua
variabel tersebut dinamakan variabel bebas (independent variable) dan variabel
terikat (dependent variable). Variabel bebas merupakan variabel yang mendasari
pendugaan atau disebut juga sebagai variabel penduga. Sedangkan variabel
terikat merupakan variabel yang diduga atau variabel yang diduga nilainya.
Tujuan utama dari analisis regresi adalah untuk menaksir nilai rata-rata
variabel random atas dasar nilai tetap variabel lainnya.
Sementara itu dalam analisis korelasi, kita akan
mengukur kekuatan atau keeratan hubungan antara kedua variabel tersebut. Tujuan
utama dari analisis korelasi adalah untuk mengukur kekuatan asosiasi linier hubungan antara dua variabel
atau lebih.
|
|
|
|
|

Gambar di atas
menggambarkan lima derajat yang berbeda korelasi: (a) merupakan korelasi
negatif yang kuat, (b) merupakan korelasi negatif moderat, (c) merupakan
korelasi positif moderat, (d) merupakan korelasi positif yang kuat, dan (e)
tidak mengandung korelasi. Apa ukuran korelasi antara tingkat suku bunga dana
federal dan indeks komoditas berjangka? Dengan data seperti yang ditunjukkan
pada tabel, yang mewakili
nilai-nilai suku bunga dana dan komoditas federal yang berjangka indeks untuk
sampel 12 hari, koefisien korelasi,
r, dapat dihitung.
Menghitung
nilai r untuk ekonomi:


Hasil
menggunakan excel:

B.
Analisis
Regresi Sederhana
Analisis regresi adalah suatu teknik statistika yang
digunakan untuk mengembangkan persamaan matematik yang menggambarkan hubungan
variabel-variabel. Variabel yang akan diperkirakan (estimasi) dengan persamaan
matematik tersebut disebut variabel dependen (tidak bebas), sedangkan variabel
yang digunakan untuk menghitung variabel dependen disebut variabel independen
(bebas). Dalam analisis regresi, model yang digunakan adalah model
probabilistik.
Perhitungan Menggunakan
Garis Regresi
Dalam diagram pencar, garis regresi diletakkan
dengan mencocokkan garis visual di antara data yang diamati. Dalam bagian ini
kita dapat menghitung garis regresi yang lebih tepat dengan menggunakan
persamaan dua variabel secara matematika. Di sini kita menguji hubungan linier
antara dua variabel yang diamati.
Persamaan untuk sebuah garis lurus di mana variabel
tergantung atau variabel tidak bebas (y) ditentukan oleh variabel bebas (x)
adalah:
Y
= a + b X
Dimana:
Y : variabel dependen (variabel
tergantung)
X : variabel independen (variabel bebas)
b : koefisien arah atau lereng garis
yang bersangkutan
a : konstanta
Dalam
statistik, bentuk lereng intersept
dari persamaan garis regresi melalui poin populasi adalah:
Ý
= ßo + ß1X
Dimana:
Ý : nilai prediksi dari variabel Y
berdasarkan nilai dari variabel X
ßo : intersept populasi Y
ß1 : kemiringan
garis populasi
Menghitung β1:

Rumus
di atas dapat dipecahkan lagi menjadi beberapa rumus


Sehingga
dapat disederhanakan menjadi

Menghitung βo:

Sehingga
dari data-data dalam tabel dapat dihitung menggunakan rumus-rumus di atas:

Hasil menggunakan excel:





C.
Analisis Residual
Residual adalah selisih antara nilai observasi dengan nilai
duga (predicted value).

Hasil menggunakan excel:

D.
Standard Error Of The Estimate
Residual merupakan kesalahan dari estimasi untuk poin individu. Dengan sampel data yang
besar, perhitungan residual menjadi melelahkan. Bahkan dengan komputer,
peneliti kadang-kadang memiliki kesulitan bekerja melalui halaman residual dalam
upaya untuk memahami kesalahan dari model regresi. cara alternatif memeriksa
kesalahan dari model tersebut adalah
dengan standard error dari estimasi, yang menyediakan pengukuran tunggal
dari kesalahan regresi.
Karena jumlah dari
residu adalah nol, mencoba untuk menentukan jumlah total kesalahan dengan
menjumlahkan residual adalah sia-sia. Ini karakteristik zero-sum residu dapat
dihindari dengan mengkuadratkan residual dan kemudian menjumlahkan mereka.
Tabel 12.6 berisi
data biaya maskapai dari Tabel 12.3, bersama dengan residu dan residu kuadrat.
Total kolom residual kuadrat disebut jumlah kuadrat kesalahan (SSE).

Secara teori, jauh
lebih banyak garis yang tepat untuk sampel poin. Namun, formula 12.2 dan 12.4
menghasilkan garis yang paling cocok dimana untuk SSE adalah yang terkecil untuk setiap baris
yang bisa fit dengan data sampel. Hasil ini dijamin, karena formula 12.2 dan
12.4 berasal dari kalkulus untuk meminimalkan SSE. Untuk alasan ini, proses
regresi yang digunakan dalam bab ini disebut regresi kuadrat terkecil.
Sebuah versi
komputasi dari persamaan untuk menghitung SSE kurang bermakna dalam hal
interpretasi dari
2 tetapi biasanya lebih mudah untuk menghitung.
Rumus komputasi untuk SSE adalah sebagai berikut.


Contoh pada biaya
maskapai



Sedikit perbedaan
antara nilai ini dan nilai dihitung pada Tabel 12.6 adalah karena kesalahan
pembulatan.
The sum of squares error adalah sebagian fungsi dari jumlah pasangan
data yang digunakan untuk menghitung jumlah, yang mengurangi nilai SSE sebagai
pengukuran kesalahan. Sebuah pengukuran yang lebih berguna dari kesalahan
adalah kesalahan standar estimasi. Standard error dari estimasi, dilambangkan se,
adalah standar deviasi dari kesalahan dari model regresi dan memiliki
penggunaan yang lebih praktis daripada SSE. Standard error dari estimasi
berikut.

Standard error dari
estimasi untuk contoh biaya maskapai adalah

Bagaimana standard
error dari estimasi yang digunakan? Seperti disebutkan sebelumnya, standard
error dari estimasi adalah standar deviasi dari kesalahan. Ingat dari Bab 3
bahwa jika data sekitar terdistribusi normal, aturan empiris menyatakan bahwa
sekitar 68% dari semua nilai berada dalam
dan
bahwa sekitar 95% dari semua nilai berada dalam
. Salah satu asumsi regresi menyatakan bahwa
untuk diberikan
istilah error berdistribusi normal. Karena
istilah error terdistribusi secara normal, se
adalah standar deviasi dari kesalahan, dan rata-rata error adalah nol, sekitar
68% dari kesalahan nilai (residu) harus berjarak
se dan 95% dari nilai error (residual) harus
berjarak
se. Dengan memiliki pengetahuan tentang
variabel yang diteliti dan dengan memeriksa nilai se, peneliti dapat sering membuat penilaian tentang fit
dari model regresi untuk data dengan menggunakan se. Bagaimana bisa nilai se untuk contoh biaya maskapai ditafsirkan?





Model regresi dalam
contoh yang digunakan untuk memprediksi biaya penerbangan dengan jumlah
penumpang. Perhatikan bahwa kisaran biaya maskapai data dalam Tabel 12.3 adalah
4.08-5.64 ($4,080 sampai $5,640). Model regresi untuk data menghasilkan sebuah
se dari 0.1773. Sebuah interpretasi dari se adalah bahwa
standar deviasi dari kesalahan untuk biaya maskapai contoh adalah $177.30. Jika
hal kesalahan yang terdistribusi normal tentang nilai-nilai tertentu x, sekitar 68% dari istilah kesalahan
akan berada dalam
$177.30 dan 95% akan berada dalam
2($177.30) =
$354.60. Pemeriksaan residual mengungkapkan
bahwa 100% dari residual berada dalam 2se.
Standard error dari estimasi memberikan ukuran tunggal kesalahan, yang, jika
peneliti memiliki latar belakang yang cukup di daerah yang dianalisis, dapat
digunakan untuk memahami besarnya kesalahan dalam model. Selain itu, beberapa
peneliti menggunakan standard error dari estimasi untuk mengidentifikasi
outlier. Mereka melakukannya dengan mencari data yang di luar
2se
atau
3se.





E.
Coefficient Of Determination
Ukuran banyak
digunakan cocok untuk model regresi adalah koefisien determinasi, atau r2.
Koefisien determinasi adalah proporsi variabilitas variabel dependen (y) menyumbang atau dijelaskan oleh
variabel independen (x).
Koefisien determinasi
berkisar dari 0 sampai 1. r2 dari nol berarti bahwa prediktor yang
menyumbang tidak ada variabilitas variabel dependen dan bahwa tidak ada
prediksi regresi y dengan x. r2 dari 1 berarti prediksi
sempurna dari y dengan x dan 100% dari variabilitas y dicatat oleh x. Tentu saja, sebagian besar nilai r2 adalah antara
ekstrem. peneliti harus menafsirkan apakah r2 tertentu tinggi atau
rendah, tergantung pada penggunaan model dan konteks di mana model
dikembangkan.
Dalam penelitian
eksplorasi dimana variabel yang kurang dipahami, nilai-nilai rendah r2
cenderung lebih diterima daripada di bidang penelitian di mana parameter yang
lebih maju dan dipahami. Salah satu peneliti NASA yang menggunakan berat badan
kendaraan untuk pra- pencarian biaya misi dict untuk model regresi memiliki r2
dari 0.90 atau lebih tinggi. Namun, seorang peneliti bisnis yang mencoba untuk
mengembangkan model untuk memprediksi tingkat motivasi karyawan mungkin senang
untuk mendapatkan r2 dekat 0,50 dalam penelitian awal.
Variabel dependen, y, yang diprediksi dalam model regresi
memiliki variasi yang diukur dengan jumlah kuadrat dari y (SSyy):

Dan adalah jumlah deviasi
kuadrat dari nilai-nilai y dari nilai rata-rata dari y. Variabel ini dapat dibagi menjadi dua variasi aditif: variasi
menjelaskan, diukur dengan jumlah kuadrat regresi (SSR), dan variasi
dijelaskan, diukur dengan jumlah kuadrat kesalahan (SSE). Hubungan ini dapat
dinyatakan dalam bentuk persamaan sebagai

Jika setiap istilah dalam
persamaan dibagi dengan SSyy,
persamaan yang dihasilkan

r2 istilah
proporsi variabilitas y yang dijelaskan oleh model regresi dan diwakili di sini
sebagai

Dengan mensubstitusi
persamaan ini ke dalam hubungan sebelumnya memberikan

Pemecahan untuk r2
menghasilkan rumus 12.5.

Nilai r2 untuk
biaya maskapai contoh diselesaikan sebagai berikut:

Artinya, 89,9% dari variabilitas biaya terbang sebuah pesawat
Boeing 737 pada penerbangan komersil dijelaskan oleh variasi dalam jumlah
penumpang. Hasil ini juga berarti bahwa 11,1% dari varians dalam biaya
penerbangan maskapai, y, adalah belum
ditemukan oleh x atau dijelaskan oleh
model regresi.
Koefisien determinasi
dapat diselesaikan untuk langsung dengan menggunakan

Hal ini dapat ditunjukkan
melalui aljabar

Dari persamaan ini,
formula komputasi untuk r2 dapat dikembangkan.

Untuk biaya maskapai
contoh, b1 = 0,0407016, SSxx
= 1.689, dan SSyy =
3,11209. Menggunakan rumus komputasi untuk hasil r2
F.
Hypotesis Tests For The Slope Of The Regression Model
and
Testing The Overall Model
Testing the Slope
Sebuah
uji hipotesis dapat dilakukan di lereng sampel dari model regresi untuk
menentukan apakah lereng penduduk secara signifikan berbeda dari nol. Tes ini
adalah cara lain untuk menentukan seberapa baik model regresi cocok dengan
data. Misalkan seorang peneliti memutuskan bahwa itu tidak sebanding dengan
usaha untuk mengembangkan model regresi linear untuk memprediksi y dari x. Sebuah pendekatan alternatif mungkin untuk rata-rata nilai y dan menggunakan
sebagai
prediktor y untuk semua nilai x. Untuk biaya maskapai contoh, daripada
menggunakan jumlah penumpang sebagai prediktor, peneliti akan menggunakan nilai
rata-rata biaya penerbangan,
,
sebagai prediktor tersebut. Dalam hal ini nilai rata-rata y adalah



Menggunakan
hasil ini sebagai model untuk memprediksi y,
jika jumlah penumpang adalah 61, 70, atau 95-atau nomor-nilai prediksi lain y masih 4.7242. Pada dasarnya,
pendekatan ini sesuai dengan garis
= 4.7242 melalui data, yang merupakan garis
horizontal dengan kemiringan nol. Mungkin kah analisis regresi menawarkan
sesuatu yang lebih dari model
?
Dengan menggunakan model non-regression
ini (
model) sebagai kasus terburuk, peneliti dapat
menganalisis garis regresi untuk menentukan apakah itu menambah jumlah yang
lebih signifikan dari prediktabilitas y
daripada
model. Karena kemiringan
garis
nol, salah satu cara untuk menentukan apakah garis regresi menambahkan
prediktabilitas signifikan adalah untuk menguji kemiringan populasi garis
regresi untuk mengetahui apakah lereng berbeda dari nol. Sebagai kemiringan
garis regresi menyimpang dari nol, model regresi menambahkan prediktabilitas
bahwa
garis tidak menghasilkan. Untuk alasan ini,
menguji kemiringan garis regresi untuk menentukan apakah lereng berbeda dari
nol adalah penting. Jika lereng tidak berbeda dari nol, garis regresi adalah
melakukan tidak lebih dari garis
dalam memprediksi y.







Bagaimana
peneliti pergi tentang pengujian kemiringan garis regresi? Mengapa tidak hanya
memeriksa kemiringan sampel yang diamati? Misalnya, kemiringan garis regresi
untuk biaya maskapai data 0.0407. Nilai ini jelas tidak nol. Masalahnya adalah
bahwa kemiringan ini diperoleh dari sampel 12 titik data; dan jika sampel lain
diambil, ada kemungkinan bahwa kemiringan yang berbeda akan diperoleh. Untuk
alasan ini, kemiringan populasi secara statistik diuji dengan menggunakan
lereng sampel. Pertanyaannya adalah: Jika semua pasangan titik data untuk
populasi yang tersedia, akan kemiringan garis regresi berbeda dari nol? Berikut
lereng sampel, b1, digunakan sebagai bukti untuk menguji apakah
kemiringan populasi berbeda dari nol. Hipotesis untuk pengujian ini mengikuti.

Perhatikan
bahwa tes ini adalah dua ekor. Hipotesis nol dapat ditolak jika lereng adalah
baik negatif atau positif. Sebuah kemiringan negatif menunjukkan hubungan
terbalik antara x dan y. Artinya, nilai-nilai yang lebih besar
dari x terkait dengan nilai-nilai
yang lebih kecil dari y, dan
sebaliknya. Kedua lereng negatif dan positif bisa berbeda dari nol. Untuk
menentukan apakah ada hubungan positif yang signifikan antara dua variabel,
hipotesis akan satu ekor, atau

Untuk
menguji hubungan negatif yang signifikan antara dua variabel, hipotesis juga
akan menjadi salah satu ekor, atau

Dalam
setiap kasus, pengujian hipotesis nol melibatkan uji t lereng.

Uji
kemiringan garis regresi untuk model regresi biaya maskapai untuk
=
0.05 berikut. Garis regresi diturunkan untuk data yang


Kemiringan
sampel 0.0407 = b1. Nilai se
adalah 0.1773,
= 930,
=
73,764, dan n = 12. hipotesis yang



df
= n - 2 = 12 - 2 = 10. Seperti tes
ini adalah dua ekor, sebuah
2
= 0,025. Tabel nilai t adalah t.025,10
=
2.228.
t nilai diamati untuk kemiringan sampel ini



Seperti
ditunjukkan dalam Gambar 12.14, nilai t
dihitung dari lereng sampel jatuh di daerah penolakan dan p-value adalah 0.00000014. Hipotesis nol bahwa kemiringan populasi
adalah nol ditolak. model regresi linear ini menambahkan informasi yang lebih
signifikan prediktif ke
Model (tidak ada regresi).

Hal ini diinginkan untuk menolak
hipotesis nol dalam pengujian kemiringan model regresi. Dalam menolak hipotesis
nol dari lereng populasi nol, kita menyatakan bahwa model regresi menambahkan
sesuatu pada penjelasan variasi dari variabel dependen bahwa nilai rata-rata
Model tidak. Kegagalan untuk menolak hipotesis
nol dalam tes ini menyebabkan peneliti untuk menyimpulkan bahwa model regresi
tidak memiliki prediktabilitas variabel dependen, dan model, oleh karena itu,
memiliki sedikit atau tidak ada gunanya.


G. Estimation
Salah satu kegunaan
utama analisis regresi adalah sebagai alat prediksi. Jika fungsi regresi adalah
sebagai model yang baik, peneliti dapat menggunakan persamaan regresi untuk
menentukan nilai dari variabel dependen dari berbagai nilai variabel
independen. Misalnya, broker keuangan ingin memiliki model yang bisa memprediksi
harga jual saham pada hari tertentu dengan variabel seperti tingkat
pengangguran atau indeks harga produsen. Manajer pemasaran ingin memiliki model
situs lokasi yang mereka bisa prediksi volume penjualan lokasi baru oleh
variabel seperti kepadatan penduduk atau jumlah pesaing. Biaya maskapai
misalnya menyajikan model regresi yang memiliki potensi untuk memprediksi biaya
menerbangkan pesawat terbang dengan jumlah penumpang.
Dalam analisis
regresi sederhana, prediksi titik perkiraan y
dapat dilakukan dengan mengganti nilai yang terkait dari x ke persamaan regresi dan pemecahan untuk y. Dari biaya maskapai contoh, jika jumlah penumpang adalah x = 73, prediksi biaya penerbangan
maskapai dapat dihitung dengan menggantikan x
nilai ke dalam persamaan regresi yang ditentukan dalam sesi 12.3:


Titik estimasi
biaya diperkirakan $4.5411 atau
$4,541.10.
Confidence Intervals to Estimate the Conditional Mean of y: 

Meskipun titik
estimasi sering menarik bagi peneliti, garis regresi ditentukan oleh satu set
sampel titik; dan jika sampel yang berbeda diambil, garis yang berbeda akan
menghasilkan, menghasilkan estimasi titik yang berbeda. Oleh karena itu
komputasi interval kepercayaan untuk estimasi sering berguna. Karena untuk
setiap nilai x (variabel bebas) akan
ada banyak nilai-nilai y (variabel
dependen), salah satu jenis interval kepercayaan adalah perkiraan nilai
rata-rata dari y untuk x yang diberikan. Nilai rata-rata ini y dinotasikan E (yx) -yang
nilai yang diharapkan dari y dan
dapat dihitung dengan menggunakan rumus (12.6).

Penerapan formula
ini dapat diilustrasikan dengan pembangunan interval kepercayaan 95% untuk
memperkirakan nilai rata-rata y
(biaya airline) untuk biaya maskapai misalnya ketika x (jumlah penumpang) adalah 73. Untuk interval kepercayaan 95%,
sebuah
dan
. Dengan df = n-2 = 12-2 = 10. Tabel nilai t adalah t.025,10=2.228.
nilai lain yang dibutuhkan dalam masalah, yang diselesaikan untuk sebelumnya,
adalah



Untuk x0 = 73, nilai
adalah 4.5411. Selang kepercayaan menghitung
untuk nilai rata-rata dari y, E (y73),
adalah


Artinya, dengan
keyakinan 95% nilai rata-rata dari y
untuk x = 73 adalah antara 4.4191 dan
4.6631.
Tabel 12.7
menunjukkan interval kepercayaan dihitung untuk biaya maskapai contoh bagi
nilai-nilai beberapa wakil dari x untuk
memperkirakan nilai rata-rata dari y.
Perhatikan bahwa x nilai mendapatkan
lebih jauh dari rata-rata nilai x
(77.5), interval kepercayaan semakin luas; sebagai x nilai lebih dekat dengan mean, kepercayaan interval sempit.
Alasannya adalah bahwa pembilang dari istilah kedua di bawah tanda radikal
mendekati nol sebagai nilai x
mendekati mean dan meningkat sebagai x
berangkat dari mean.
Prediction Intervals to Estimate a Single Value of y
Tipe kedua dari
interval dalam estimasi regresi interval prediksi untuk memperkirakan nilai
tunggal dari y untuk nilai tertentu x.


Formula 12.7 hampir
sama dengan rumus 12.6, kecuali untuk nilai tambahan 1 di bawah radikal. Nilai
tambah ini memperlebar interval prediksi untuk memperkirakan nilai tunggal y dari interval kepercayaan untuk
memperkirakan nilai rata-rata y.
Hasil ini tampaknya logis karena nilai rata-rata y adalah menuju tengah sekelompok nilai y. Dengan demikian selang kepercayaan untuk memperkirakan rata-rata
tidak perlu selebar interval prediksi yang dihasilkan oleh rumus 12.7, yang
memperhitungkan semua nilai y untuk x yang diberikan.
Interval prediksi
95% dapat dihitung untuk memperkirakan nilai tunggal y untuk x = 73 dari biaya
maskapai misalnya dengan menggunakan rumus 12.7. Nilai-nilai yang sama
digunakan untuk membangun interval kepercayaan untuk memperkirakan nilai
rata-rata dari y yang digunakan di
sini.

Untuk x0
= 73, nilai
=
4.5411. Prediksi interval komputasi untuk nilai tunggal y adalah


Prediksi interval
dapat diperoleh dengan menggunakan komputer. Ditunjukkan dalam Gambar 12.15
adalah output komputer untuk contoh biaya maskapa. Output menampilkan nilai
prediksi untuk x = 73 (
=
4.5411), interval kepercayaan 95% untuk nilai rata-rata dari y untuk x = 73, dan interval prediksi 95% untuk nilai tunggal dari y untuk x= 73. Catatan bahwa nilai-nilai yang dihasilkan hampir sama dengan
yang dihitung dalam bagian ini.

Pemeriksaan rumus
interval prediksi untuk memperkirakan y
untuk nilai tertentu x menjelaskan
mengapa interval sukar keluar.

Seperti kita
memasukkan nilai-nilai yang berbeda dari x0
dari analisis regresi ke dalam persamaan, satu-satunya hal yang berubah dalam
persamaan adalah (x0 -
)2. Ungkapan ini meningkatkan
nilai-nilai individu x0 mendapatkan
lebih jauh dari rata-rata, sehingga peningkatan lebar interval. interval sempit
untuk nilai x0 dekat x dan luas untuk nilai x0 jauh dari x. Perbandingan formula 12.6 dan 12.7
mengungkapkan mereka untuk menjadi identik kecuali formula yang 12.7 untuk
menghitung interval prediksi untuk memperkirakan y untuk nilai tertentu x-mengandung
1 di bawah tanda radikal. perbedaan ini memastikan bahwa formula 12.7 akan
menghasilkan interval lebih lebar dari 12.6 untuk data yang dinyatakan identik.

H. Menggunakan Regresi Untuk Pengembangan Peramalan Trend Line
Peneliti bisnis sering
menggunakan data historis dengan langkah-langkah yang diambil dari waktu ke
waktu dalam upaya untuk meramalkan apa yang mungkin terjadi di masa depan.
Sebuah jenis tertentu dari data yang sering cocok untuk analisis ini adalah data
time-series didefinisikan sebagai data yang dikumpulkan pada karakteristik
tertentu selama periode waktu secara berkala. Beberapa contoh data time-series
adalah 10 tahun mingguan Dow Jones Industrial Averages, dua belas bulan dari
produksi minyak harian, atau bulanan konsumsi kopi selama dua tahun. Untuk
menjadi berguna untuk peramal, pengukuran time-series perlu dibuat dalam
interval waktu yang teratur dan diatur sesuai dengan waktu kejadian. Seperti contoh,
mempertimbangkan data penjualan time-series selama periode waktu 10 tahun untuk
Huntsville Chemical Company ditunjukkan pada Tabel 12.8. Perhatikan bahwa
pengukuran (penjualan) diambil dari waktu ke waktu dan bahwa angka penjualan
yang diberikan secara tahunan. data time-series dapat juga dilaporkan harian,
mingguan, bulanan, triwulanan, semesteran, atau untuk periode waktu pasti
lainnya.

Hal ini umumnya dipercaya bahwa data time-series mengandung satu atau kombinasi dari empat elemen : trend, cyclicality, seasonality, dan irregularity. masing-masing empat elemen ini akan dibahas dalam kesepakatan yang lebih besar dalam Bab 15, Time - Series Forecasting dan Indeks Nomor, di sini kita memeriksa tren dan mendefinisikannya sebagai arah umum data jangka panjang. Mengamati plot pencar dari data penjualan Huntsville Chemical Company ditunjukkan dalam Gambar 12.17, jelas bahwa ada tren positif dalam data. Artinya , tampaknya ada yang menjadi atas arah umum jangka panjang dari penjualan dari waktu ke waktu. Bagaimana tren dinyatakan dalam istilah matematika ? Di bidang peramalan, itu adalah umum untuk mencoba agar sesuai garis tren melalui data time - series dengan menentukan persamaan garis tren dan kemudian menggunakan persamaan garis tren untuk memprediksi titik data masa depan.
Menentukan Persamaan Garis Trend
Mengembangkan persamaan garis tren linear dalam peramalan sebenarnya merupakan kasus khusus dari regresi sederhana dimana variabel y atau tergantung adalah variabel bunga yang bisnis Analis ingin untuk meramalkan dan untuk yang satu set pengukuran telah mengambil alih periode waktu. Misalnya, dengan data Huntsville Kimia Company, jika perusahaan peramal ingin memprediksi penjualan untuk tahun 2012 menggunakan data ini, penjualan akan menjadi variabel dependen dalam analisis regresi sederhana. Dalam analisis trend linear, waktu periode digunakan sebagai x, variabel independen atau prediktor, dalam analisis untuk menentukan persamaan garis tren. Dalam kasus Huntsville Chemical Company, variabel x merupakan tahun 2000-2009.
Menggunakan penjualan sebagai variabel y dan waktu (tahun) sebagai variabel x, persamaan garis tren dapat dihitung dengan cara yang biasa seperti yang ditunjukkan pada Tabel 12.9 dan bertekad untuk menjadi: ŷ = -5,320.56 + 2,6687 x. Kurva, 2,6687, berarti bahwa untuk setiap kenaikan di waktu tahunan, penjualan meningkat dengan rata-rata $ 2,6687 (juta). mencegat akan mewakili penjualan perusahaan pada tahun 0 yang, tentu saja, dalam masalah ini tidak ada artinya karena Huntsville Chemical Company tidak eksis di tahun 0.

Peramalan Menggunakan Persamaan Trend Line
Penggunaan utama dari persamaan garis tren oleh analis bisnis untuk hasil peramalan untuk periode waktu di masa depan. Ingat hati-hati dari Bagian 12,8 yang menggunakan regresi Model untuk memprediksi nilai y untuk nilai-nilai x di luar domain yang digunakan untuk mengembangkan model mungkin tidak valid. Meskipun peringatan ini dan memahami kelemahan potensial, bisnis peramal meskipun demikian ekstrapolasi garis tren di luar paling periode waktu saat ini Data dan upaya untuk memprediksi hasil untuk jangka waktu di masa depan. Untuk meramalkan masa depan periode waktu menggunakan garis tren, masukkan jangka waktu yang menarik ke dalam persamaan garis tren dan memecahkan y. Misalnya, peramal untuk Huntsville Chemicals
Perusahaan ingin memprediksi penjualan untuk tahun 2012 dengan menggunakan persamaan garis tren dikembangkan dari data time series historis mereka. Mengganti x dalam persamaan garis tren penjualan dengan 2012, menghasilkan perkiraan $ 40,85 (juta):
ŷ (2012) = -5,328.57 + 2,6687 (2012) = 40,85
Coding alternatif untuk Periode Waktu
Jika Anda secara manual menghitung persamaan garis tren saat periode waktu yang bertahun-tahun, Anda melihat bahwa perhitungan bisa mendapatkan cukup besar dan rumit (amati Tabel 12.9). Namun, jika tahun yang berturut-turut, mereka dapat terekam menggunakan banyak perbedaan mungkin skema dan masih menghasilkan persamaan yang berarti trend line (meskipun y intercept berbeda nilai). Misalnya, alih-alih menggunakan tahun 2000-2009, misalkan kita menggunakan tahun 1 sampai 10. Artinya, 2000 = 1 (tahun pertama) 2001 = 2, 2002 = 3, dan seterusnya, hingga 2009 = 10. Hal ini merekam skema menghasilkan persamaan garis tren dari: ŷ = 6,1632 + 2.6687x seperti yang ditunjukkan pada Tabel 12.10.
Perhatikan bahwa kemiringan garis tren adalah sama apakah tahun 2000 sampai 2009 adalah digunakan atau rekaman tahun dari 1 sampai 10, tapi y intercept (6,1632) berbeda. Hal ini perlu harus dipertimbangkan ketika menggunakan persamaan garis trend untuk peramalan. Sejak persamaan tren baru berasal dari data recoded, perkiraan juga akan perlu dibuat menggunakan data rekaman. Misalnya, menggunakan sistem rekaman dari 1 sampai 10 untuk mewakili "Tahun," rekaman tahun 2012 sebagai 13 (2009 = 10, 2010 = 11, 2011 = 12, dan 2012 = 13). Memasukkan nilai ini ke dalam hasil persamaan trend line dalam perkiraan $ 40,86, sama dengan Nilai yang diperoleh dengan menggunakan tahun mentah sebagai waktu.
ŷ = 6,1632 + 2.6687x = 6,1632 + 2,6687 (13) = $ 40,86 (juta).
Skema waktu rekaman sama dapat digunakan dalam perhitungan persamaan garis tren jika variabel waktu adalah sesuatu selain tahun. Misalnya, dalam kasus bulanan data time series, periode waktu dapat direkam sebagai: Januari = 1, Februari = 2, Maret = 3, Á, Desember = 12.

Dalam kasus data kuartalan selama dua tahun, periode waktu dapat recoded
dengan skema seperti:

I. Interpretasi Hasil (Output)
Meskipun perhitungan manual dapat dilakukan, sebagian besar masalah regresi dianalisis oleh menggunakan komputer. Pada bagian ini, output komputer dari Excel akan disajikan dan dibahas.
Berikutnya adalah tabel yang menggambarkan model secara lebih rinci. "Koe" singkatan koefisien istilah regresi. Koefisien Jumlah Penumpang, variabel x, adalah 0,040702. Nilai ini sama dengan kemiringan garis regresi dan tercermin dalam persamaan regresi. Koefisien ditampilkan di samping istilah konstan (1,5698) adalah nilai konstanta, yang merupakan y intercept dan juga merupakan bagian dari persamaan regresi. "T" nilai-nilai uji t untuk kurva dan uji t untuk mencegat atau konstan. (Kami umumnya tidak menafsirkan uji t untuk konstan.) t nilai untuk kurva, t = 9.44 dengan probabilitas terkait 0,000, sama dengan nilai yang diperoleh secara manual di bagian 12,7. Karena probabilitas nilai t diberikan, metode p-value dapat digunakan untuk menafsirkan nilai t.
Baris berikutnya output adalah standard error dari estimasi se, S = 0.177217; koefisien determinasi, r 2, R-Sq = 89,9%; dan nilai disesuaikan r 2, R-Sq (adj) = 88,9%. (Adjusted r 2 akan dibahas dalam Bab 13.) Berikut barang-barang ini adalah analisis varian meja. Perhatikan bahwa nilai F = 89,09 digunakan untuk menguji keseluruhan model regresi garis. Item akhir dari output adalah nilai prediksi dan sesuai sisa untuk setiap pasangan poin. Meskipun output regresi Excel, yang ditunjukkan pada Gambar 12.21 untuk Demonstrasi Soal 12.1, Persamaan regresi ditemukan di bawah Koefisien di bagian bawah ANOVA. Kemiringan atau koefisien x adalah 2,2315 dan y-intercept adalah 30,9125. Standar error dari estimasi untuk masalah sakit diberikan sebagai statistik keempat di bawah Statistik regresi di atas output, Standar Error = 15,6491. R 2 nilai adalah diberikan sebagai 0,886 pada baris kedua. Uji t untuk kurva ditemukan di bawah t Stat dekat bagian bawah dari bagian ANOVA pada "Jumlah Tempat Tidur" (x variabel) berturut-turut, t = 8.83. berdekatan dengan t Stat adalah P-nilai, yang merupakan probabilitas dari statistik t terjadi secara kebetulan jika hipotesis nol benar. Untuk kemiringan ini, probabilitas yang ditampilkan adalah 0,000005. ANOVA tabel adalah di tengah-tengah output dengan nilai F memiliki probabilitas yang sama dengan t statistik, 0.000005, dan menyamai t 2. nilai-nilai yang diprediksi dan residual yang ditampilkan dalam Sisa bagian Output.

J.
Studi Kasus
DELTA WIRE MENGGUNAAN PELATIHAN SEBAGAI SENJATA
Delta Wire Corporation didirikan pada tahun 1978 di Clarksdale, Mississippi. Perusahaan memproduksi karbon tinggi kawat baja khusus untuk pasar global dan saat ini mempekerjakan sekitar 100 orang. Selama beberapa tahun terakhir, penjualan meningkat setiap tahun.
Beberapa tahun yang lalu, hal-hal tidak terlihat cerah bagi Delta Wire karena tertangkap dalam potensi bencana mengikat. Dengan penurunan nilai dolar, persaingan asing itu menjadi ancaman untuk posisi pasar Delta. Selain kompetisi asing, kualitas industri yang berkembang Persyaratan itu menjadi lebih keras setiap tahun. Pejabat Delta menyadari bahwa beberapa kondisi, seperti nilai dolar, berada di luar kendali mereka. Namun, salah satu daerah yang mereka bisa memperbaiki adalah pendidikan karyawan. Perusahaan ini bekerja sama dengan program pelatihan yang dikembangkan oleh negara bagian Mississippi dan perguruan tinggi setempat untuk mengatur sekolah sendiri. karyawan Delta diperkenalkan ke statistik pengendalian proses dan teknik jaminan mutu lainnya. Delta meyakinkan pelanggan bahwa perusahaan bekerja keras pada meningkatkan kualitas dan tetap kompetitif. pelanggan yang diundang untuk duduk di pada sesi pendidikan. Karena ini usaha, Delta telah mampu cuaca badai dan terus untuk mempertahankan posisi kepemimpinan dalam baja yang sangat kompetitif industri kawat.
Delta melanjutkan program pelatihan dan pendidikannya. Di tahun 1990-an, Delta melembagakan program pelatihan keterampilan dasar yang akhirnya menyebabkan penurunan bahan yang tidak sesuai dari 6% menjadi 2% dan peningkatan produktivitas dari 70.000 90.000 pound per minggu. Selain itu, inisiatif ini menghasilkan "terbaik di kelasnya" penghargaan dari Goodyear, pelanggan yang terbesar.
Meskipun diakuisisi oleh Bekaert dari Belgia pada bulan Januari 2006, Delta Wire Corporation, pemasok utama manik kawat untuk penguatan ban dan produk kawat khusus lainnya untuk pasar Amerika Utara, terus beroperasi di kapasitas saat ini. Bekaert ingin mendukung Delta Wire pertumbuhan pangsa pasar dan menjamin ketersediaan produk yang memadai kepada pelanggan.
Diskusi
1. Delta Wire membanggakan diri pada upaya di bidang pendidikan karyawan. pendidikan karyawan dapat membayar dalam banyak jalan. Membahas beberapa dari mereka. Salah satu hasil dapat minat baru dan kegembiraan yang dihasilkan terhadap pekerjaan dan perusahaan. Beberapa orang berteori bahwa karena pandangan yang lebih positif dan minat menerapkan hal belajar, pendidikan yang lebih yang diterima oleh pekerja, semakin kecil kemungkinan ia untuk melewatkan hari kerja. Misalkan data berikut mewakili para jumlah hari cuti sakit yang diambil oleh 20 pekerja terakhir tahun bersama dengan jumlah jam kontak karyawan pendidikan / pelatihan yang mereka masing-masing menerima dalam tahun lalu. Gunakan teknik belajar dalam bab ini untuk menganalisis data. Mencakup baik regresi dan korelasi teknik. Diskusikan kekuatan hubungan dan setiap model yang dikembangkan.

2. Banyak perusahaan menemukan bahwa pelaksanaan total manajemen mutu akhirnya menghasilkan peningkatan penjualan. Perusahaan yang gagal untuk mengadopsi upaya kualitas kehilangan pangsa pasar dalam banyak kasus atau pergi keluar dari bisnis. Satu mengukur efek dari peningkatan kualitas perusahaan upaya adalah kepuasan pelanggan. Misalkan Delta Wire menyewa sebuah perusahaan riset untuk mengukur kepuasan pelanggan setiap tahun. Perusahaan riset dikembangkan pelanggan skala kepuasan di mana pelanggan benar-benar puas dapat penghargaan nilai setinggi 50 dan benar-benar pelanggan puas bisa skor penghargaan serendah 0. Skor yang diukur dari banyak pelanggan industri yang berbeda dan rata-rata untuk skor pelanggan rata-rata tahunan. Apakah melakukan peningkatan penjualan berkaitan peningkatan nilai kepuasan pelanggan? Untuk mempelajari gagasan ini, misalkan kepuasan pelanggan rata-rata skor setiap tahun untuk Delta wire dipasangkan dengan total penjualan perseroan tahun itu untuk 15 tahun terakhir, dan analisis regresi dijalankan pada data. Asumsikan berikut adalah Excel output. Misalkan Anda diminta oleh Delta Wire untuk menganalisis data dan meringkas hasil. Apa yang akan kamu temukan?

3. Delta Wire peningkatan produktivitas dari 70.000 ke 90.000 pound per minggu selama waktu ketika melembagakan dasar keterampilan program pelatihan . Misalkan program ini dilaksanakan selama 18 bulan dan bahwa berikut data jumlah total kumulatif keterampilan jam dasar pelatihan dan per minggu angka produktivitas diambil sebulan sekali selama waktu ini. Gunakan teknik dari ini bab untuk menganalisis data dan membuat laporan singkat untuk Delta tentang prediktabilitas produktivitas dari kumulatif jam pelatihan .

Tidak ada komentar:
Posting Komentar