Situs Berbagi Informasi: Regresi dan Model Korelasi Sederhana

A. Korelasi

Analisis regresi dan korelasi didasarkan pada hubungan atau asosiasi antara dua variabel atau lebih. Meskipun demikian, analisis regresi berbeda dengan analisis korelasi. Analisis regresi digunakan untuk data yang berskala atau rasio, dan mengasumsikan adanya hubungan antara dua atau lebih variabel yang bersifat kausalitas. Kedua variabel tersebut dinamakan variabel bebas (independent variable) dan variabel terikat (dependent variable). Variabel bebas merupakan variabel yang mendasari pendugaan atau disebut juga sebagai variabel penduga. Sedangkan variabel terikat merupakan variabel yang diduga atau variabel yang diduga nilainya. Tujuan utama dari analisis regresi adalah untuk menaksir nilai rata-rata variabel random atas dasar nilai tetap variabel lainnya.

Sementara itu dalam analisis korelasi, kita akan mengukur kekuatan atau keeratan hubungan antara kedua variabel tersebut. Tujuan utama dari analisis korelasi adalah untuk mengukur kekuatan asosiasi linier hubungan antara dua variabel atau lebih.

(e) tidak mengandung korelasi

(d) korelasi positif yang kuat

(b) korelasi negatif moderat

(a) korelasi negatif yang kuat

Gambar di atas menggambarkan lima derajat yang berbeda korelasi: (a) merupakan korelasi negatif yang kuat, (b) merupakan korelasi negatif moderat, (c) merupakan korelasi positif moderat, (d) merupakan korelasi positif yang kuat, dan (e) tidak mengandung korelasi. Apa ukuran korelasi antara tingkat suku bunga dana federal dan indeks komoditas berjangka? Dengan data seperti yang ditunjukkan pada tabel, yang mewakili nilai-nilai suku bunga dana dan komoditas federal yang berjangka indeks untuk sampel 12 hari, koefisien korelasi, r, dapat dihitung.

Menghitung nilai r untuk ekonomi:

Hasil menggunakan excel:

B. Analisis Regresi Sederhana

Analisis regresi adalah suatu teknik statistika yang digunakan untuk mengembangkan persamaan matematik yang menggambarkan hubungan variabel-variabel. Variabel yang akan diperkirakan (estimasi) dengan persamaan matematik tersebut disebut variabel dependen (tidak bebas), sedangkan variabel yang digunakan untuk menghitung variabel dependen disebut variabel independen (bebas). Dalam analisis regresi, model yang digunakan adalah model probabilistik.

Perhitungan Menggunakan Garis Regresi

Dalam diagram pencar, garis regresi diletakkan dengan mencocokkan garis visual di antara data yang diamati. Dalam bagian ini kita dapat menghitung garis regresi yang lebih tepat dengan menggunakan persamaan dua variabel secara matematika. Di sini kita menguji hubungan linier antara dua variabel yang diamati.

Persamaan untuk sebuah garis lurus di mana variabel tergantung atau variabel tidak bebas (y) ditentukan oleh variabel bebas (x) adalah:

Y = a + b X

Dimana:

Y : variabel dependen (variabel tergantung)

X : variabel independen (variabel bebas)

b : koefisien arah atau lereng garis yang bersangkutan

a : konstanta

Dalam statistik, bentuk lereng intersept dari persamaan garis regresi melalui poin populasi adalah:

Ý = ßo + ß1X

Dimana:

Ý : nilai prediksi dari variabel Y berdasarkan nilai dari variabel X

ßo : intersept populasi Y

ß1 : kemiringan garis populasi

Menghitung β1:

Rumus di atas dapat dipecahkan lagi menjadi beberapa rumus

Sehingga dapat disederhanakan menjadi

Menghitung βo:

Sehingga dari data-data dalam tabel dapat dihitung menggunakan rumus-rumus di atas:

Hasil menggunakan excel:

C. Analisis Residual

Residual adalah selisih antara nilai observasi dengan nilai duga (predicted value).

Hasil menggunakan excel:

D. Standard Error Of The Estimate

Residual merupakan kesalahan dari estimasi untuk poin individu. Dengan sampel data yang besar, perhitungan residual menjadi melelahkan. Bahkan dengan komputer, peneliti kadang-kadang memiliki kesulitan bekerja melalui halaman residual dalam upaya untuk memahami kesalahan dari model regresi. cara alternatif memeriksa kesalahan dari model tersebut adalah dengan standard error dari estimasi, yang menyediakan pengukuran tunggal dari kesalahan regresi.

Karena jumlah dari residu adalah nol, mencoba untuk menentukan jumlah total kesalahan dengan menjumlahkan residual adalah sia-sia. Ini karakteristik zero-sum residu dapat dihindari dengan mengkuadratkan residual dan kemudian menjumlahkan mereka.

Tabel 12.6 berisi data biaya maskapai dari Tabel 12.3, bersama dengan residu dan residu kuadrat. Total kolom residual kuadrat disebut jumlah kuadrat kesalahan (SSE).

Secara teori, jauh lebih banyak garis yang tepat untuk sampel poin. Namun, formula 12.2 dan 12.4 menghasilkan garis yang paling cocok dimana untuk SSE adalah yang terkecil untuk setiap baris yang bisa fit dengan data sampel. Hasil ini dijamin, karena formula 12.2 dan 12.4 berasal dari kalkulus untuk meminimalkan SSE. Untuk alasan ini, proses regresi yang digunakan dalam bab ini disebut regresi kuadrat terkecil.

Sebuah versi komputasi dari persamaan untuk menghitung SSE kurang bermakna dalam hal interpretasi dari

²tetapi biasanya lebih mudah untuk menghitung. Rumus komputasi untuk SSE adalah sebagai berikut.

Contoh pada biaya maskapai

Sedikit perbedaan antara nilai ini dan nilai dihitung pada Tabel 12.6 adalah karena kesalahan pembulatan.

The sum of squares error adalah sebagian fungsi dari jumlah pasangan data yang digunakan untuk menghitung jumlah, yang mengurangi nilai SSE sebagai pengukuran kesalahan. Sebuah pengukuran yang lebih berguna dari kesalahan adalah kesalahan standar estimasi. Standard error dari estimasi, dilambangkan s_e, adalah standar deviasi dari kesalahan dari model regresi dan memiliki penggunaan yang lebih praktis daripada SSE. Standard error dari estimasi berikut.

Standard error dari estimasi untuk contoh biaya maskapai adalah

Bagaimana standard error dari estimasi yang digunakan? Seperti disebutkan sebelumnya, standard error dari estimasi adalah standar deviasi dari kesalahan. Ingat dari Bab 3 bahwa jika data sekitar terdistribusi normal, aturan empiris menyatakan bahwa sekitar 68% dari semua nilai berada dalam

dan bahwa sekitar 95% dari semua nilai berada dalam

. Salah satu asumsi regresi menyatakan bahwa untuk diberikan

istilah error berdistribusi normal. Karena istilah error terdistribusi secara normal, s_e adalah standar deviasi dari kesalahan, dan rata-rata error adalah nol, sekitar 68% dari kesalahan nilai (residu) harus berjarak

s_e dan 95% dari nilai error (residual) harus berjarak

s_e. Dengan memiliki pengetahuan tentang variabel yang diteliti dan dengan memeriksa nilai s_e, peneliti dapat sering membuat penilaian tentang fit dari model regresi untuk data dengan menggunakan s_e. Bagaimana bisa nilai s_e untuk contoh biaya maskapai ditafsirkan?

Model regresi dalam contoh yang digunakan untuk memprediksi biaya penerbangan dengan jumlah penumpang. Perhatikan bahwa kisaran biaya maskapai data dalam Tabel 12.3 adalah 4.08-5.64 ($4,080 sampai $5,640). Model regresi untuk data menghasilkan sebuah s_e dari 0.1773. Sebuah interpretasi dari s_e adalah bahwa standar deviasi dari kesalahan untuk biaya maskapai contoh adalah $177.30. Jika hal kesalahan yang terdistribusi normal tentang nilai-nilai tertentu x, sekitar 68% dari istilah kesalahan akan berada dalam

$177.30 dan 95% akan berada dalam

2($177.30) =

$354.60. Pemeriksaan residual mengungkapkan bahwa 100% dari residual berada dalam 2s_e. Standard error dari estimasi memberikan ukuran tunggal kesalahan, yang, jika peneliti memiliki latar belakang yang cukup di daerah yang dianalisis, dapat digunakan untuk memahami besarnya kesalahan dalam model. Selain itu, beberapa peneliti menggunakan standard error dari estimasi untuk mengidentifikasi outlier. Mereka melakukannya dengan mencari data yang di luar

2s_e atau

3s_e.

E. Coefficient Of Determination

Ukuran banyak digunakan cocok untuk model regresi adalah koefisien determinasi, atau r². Koefisien determinasi adalah proporsi variabilitas variabel dependen (y) menyumbang atau dijelaskan oleh variabel independen (x).

Koefisien determinasi berkisar dari 0 sampai 1. r² dari nol berarti bahwa prediktor yang menyumbang tidak ada variabilitas variabel dependen dan bahwa tidak ada prediksi regresi y dengan x. r² dari 1 berarti prediksi sempurna dari y dengan x dan 100% dari variabilitas y dicatat oleh x. Tentu saja, sebagian besar nilai r² adalah antara ekstrem. peneliti harus menafsirkan apakah r² tertentu tinggi atau rendah, tergantung pada penggunaan model dan konteks di mana model dikembangkan.

Dalam penelitian eksplorasi dimana variabel yang kurang dipahami, nilai-nilai rendah r² cenderung lebih diterima daripada di bidang penelitian di mana parameter yang lebih maju dan dipahami. Salah satu peneliti NASA yang menggunakan berat badan kendaraan untuk pra- pencarian biaya misi dict untuk model regresi memiliki r² dari 0.90 atau lebih tinggi. Namun, seorang peneliti bisnis yang mencoba untuk mengembangkan model untuk memprediksi tingkat motivasi karyawan mungkin senang untuk mendapatkan r² dekat 0,50 dalam penelitian awal.

Variabel dependen, y, yang diprediksi dalam model regresi memiliki variasi yang diukur dengan jumlah kuadrat dari y (SS_yy):

Dan adalah jumlah deviasi kuadrat dari nilai-nilai y dari nilai rata-rata dari y. Variabel ini dapat dibagi menjadi dua variasi aditif: variasi menjelaskan, diukur dengan jumlah kuadrat regresi (SSR), dan variasi dijelaskan, diukur dengan jumlah kuadrat kesalahan (SSE). Hubungan ini dapat dinyatakan dalam bentuk persamaan sebagai

Jika setiap istilah dalam persamaan dibagi dengan SS_yy, persamaan yang dihasilkan

r² istilah proporsi variabilitas y yang dijelaskan oleh model regresi dan diwakili di sini sebagai

Dengan mensubstitusi persamaan ini ke dalam hubungan sebelumnya memberikan

Pemecahan untuk r² menghasilkan rumus 12.5.

Nilai r² untuk biaya maskapai contoh diselesaikan sebagai berikut:

Artinya, 89,9% dari variabilitas biaya terbang sebuah pesawat Boeing 737 pada penerbangan komersil dijelaskan oleh variasi dalam jumlah penumpang. Hasil ini juga berarti bahwa 11,1% dari varians dalam biaya penerbangan maskapai, y, adalah belum ditemukan oleh x atau dijelaskan oleh model regresi.

Koefisien determinasi dapat diselesaikan untuk langsung dengan menggunakan

Hal ini dapat ditunjukkan melalui aljabar

Dari persamaan ini, formula komputasi untuk r² dapat dikembangkan.

Untuk biaya maskapai contoh, b₁ = 0,0407016, SS_xx = 1.689, dan SS_yy = 3,11209. Menggunakan rumus komputasi untuk hasil r²

F. Hypotesis Tests For The Slope Of The Regression Model and Testing The Overall Model

Testing the Slope

Sebuah uji hipotesis dapat dilakukan di lereng sampel dari model regresi untuk menentukan apakah lereng penduduk secara signifikan berbeda dari nol. Tes ini adalah cara lain untuk menentukan seberapa baik model regresi cocok dengan data. Misalkan seorang peneliti memutuskan bahwa itu tidak sebanding dengan usaha untuk mengembangkan model regresi linear untuk memprediksi y dari x. Sebuah pendekatan alternatif mungkin untuk rata-rata nilai y dan menggunakan

sebagai prediktor y untuk semua nilai x. Untuk biaya maskapai contoh, daripada menggunakan jumlah penumpang sebagai prediktor, peneliti akan menggunakan nilai rata-rata biaya penerbangan,

, sebagai prediktor tersebut. Dalam hal ini nilai rata-rata y adalah

Menggunakan hasil ini sebagai model untuk memprediksi y, jika jumlah penumpang adalah 61, 70, atau 95-atau nomor-nilai prediksi lain y masih 4.7242. Pada dasarnya, pendekatan ini sesuai dengan garis

= 4.7242 melalui data, yang merupakan garis horizontal dengan kemiringan nol. Mungkin kah analisis regresi menawarkan sesuatu yang lebih dari model

? Dengan menggunakan model non-regression ini (

model) sebagai kasus terburuk, peneliti dapat menganalisis garis regresi untuk menentukan apakah itu menambah jumlah yang lebih signifikan dari prediktabilitas y daripada

model. Karena kemiringan

garis nol, salah satu cara untuk menentukan apakah garis regresi menambahkan prediktabilitas signifikan adalah untuk menguji kemiringan populasi garis regresi untuk mengetahui apakah lereng berbeda dari nol. Sebagai kemiringan garis regresi menyimpang dari nol, model regresi menambahkan prediktabilitas bahwa

garis tidak menghasilkan. Untuk alasan ini, menguji kemiringan garis regresi untuk menentukan apakah lereng berbeda dari nol adalah penting. Jika lereng tidak berbeda dari nol, garis regresi adalah melakukan tidak lebih dari garis

dalam memprediksi y.

Bagaimana peneliti pergi tentang pengujian kemiringan garis regresi? Mengapa tidak hanya memeriksa kemiringan sampel yang diamati? Misalnya, kemiringan garis regresi untuk biaya maskapai data 0.0407. Nilai ini jelas tidak nol. Masalahnya adalah bahwa kemiringan ini diperoleh dari sampel 12 titik data; dan jika sampel lain diambil, ada kemungkinan bahwa kemiringan yang berbeda akan diperoleh. Untuk alasan ini, kemiringan populasi secara statistik diuji dengan menggunakan lereng sampel. Pertanyaannya adalah: Jika semua pasangan titik data untuk populasi yang tersedia, akan kemiringan garis regresi berbeda dari nol? Berikut lereng sampel, b₁, digunakan sebagai bukti untuk menguji apakah kemiringan populasi berbeda dari nol. Hipotesis untuk pengujian ini mengikuti.

Perhatikan bahwa tes ini adalah dua ekor. Hipotesis nol dapat ditolak jika lereng adalah baik negatif atau positif. Sebuah kemiringan negatif menunjukkan hubungan terbalik antara x dan y. Artinya, nilai-nilai yang lebih besar dari x terkait dengan nilai-nilai yang lebih kecil dari y, dan sebaliknya. Kedua lereng negatif dan positif bisa berbeda dari nol. Untuk menentukan apakah ada hubungan positif yang signifikan antara dua variabel, hipotesis akan satu ekor, atau

Untuk menguji hubungan negatif yang signifikan antara dua variabel, hipotesis juga akan menjadi salah satu ekor, atau

Dalam setiap kasus, pengujian hipotesis nol melibatkan uji t lereng.

Uji kemiringan garis regresi untuk model regresi biaya maskapai untuk

= 0.05 berikut. Garis regresi diturunkan untuk data yang

Kemiringan sampel 0.0407 = b₁. Nilai s_e adalah 0.1773,

= 930,

= 73,764, dan n = 12. hipotesis yang

df = n - 2 = 12 - 2 = 10. Seperti tes ini adalah dua ekor, sebuah

2 = 0,025. Tabel nilai t adalah t_.025,10 =

2.228. t nilai diamati untuk kemiringan sampel ini

Seperti ditunjukkan dalam Gambar 12.14, nilai t dihitung dari lereng sampel jatuh di daerah penolakan dan p-value adalah 0.00000014. Hipotesis nol bahwa kemiringan populasi adalah nol ditolak. model regresi linear ini menambahkan informasi yang lebih signifikan prediktif ke

Model (tidak ada regresi).

Hal ini diinginkan untuk menolak hipotesis nol dalam pengujian kemiringan model regresi. Dalam menolak hipotesis nol dari lereng populasi nol, kita menyatakan bahwa model regresi menambahkan sesuatu pada penjelasan variasi dari variabel dependen bahwa nilai rata-rata

Model tidak. Kegagalan untuk menolak hipotesis nol dalam tes ini menyebabkan peneliti untuk menyimpulkan bahwa model regresi tidak memiliki prediktabilitas variabel dependen, dan model, oleh karena itu, memiliki sedikit atau tidak ada gunanya.

G. Estimation

Salah satu kegunaan utama analisis regresi adalah sebagai alat prediksi. Jika fungsi regresi adalah sebagai model yang baik, peneliti dapat menggunakan persamaan regresi untuk menentukan nilai dari variabel dependen dari berbagai nilai variabel independen. Misalnya, broker keuangan ingin memiliki model yang bisa memprediksi harga jual saham pada hari tertentu dengan variabel seperti tingkat pengangguran atau indeks harga produsen. Manajer pemasaran ingin memiliki model situs lokasi yang mereka bisa prediksi volume penjualan lokasi baru oleh variabel seperti kepadatan penduduk atau jumlah pesaing. Biaya maskapai misalnya menyajikan model regresi yang memiliki potensi untuk memprediksi biaya menerbangkan pesawat terbang dengan jumlah penumpang.

Dalam analisis regresi sederhana, prediksi titik perkiraan y dapat dilakukan dengan mengganti nilai yang terkait dari x ke persamaan regresi dan pemecahan untuk y. Dari biaya maskapai contoh, jika jumlah penumpang adalah x = 73, prediksi biaya penerbangan maskapai dapat dihitung dengan menggantikan x nilai ke dalam persamaan regresi yang ditentukan dalam sesi 12.3:

Titik estimasi biaya diperkirakan $4.5411 atau $4,541.10.

Confidence Intervals to Estimate the Conditional Mean of y:

Meskipun titik estimasi sering menarik bagi peneliti, garis regresi ditentukan oleh satu set sampel titik; dan jika sampel yang berbeda diambil, garis yang berbeda akan menghasilkan, menghasilkan estimasi titik yang berbeda. Oleh karena itu komputasi interval kepercayaan untuk estimasi sering berguna. Karena untuk setiap nilai x (variabel bebas) akan ada banyak nilai-nilai y (variabel dependen), salah satu jenis interval kepercayaan adalah perkiraan nilai rata-rata dari y untuk x yang diberikan. Nilai rata-rata ini y dinotasikan E (y_x) -yang nilai yang diharapkan dari y dan dapat dihitung dengan menggunakan rumus (12.6).

Penerapan formula ini dapat diilustrasikan dengan pembangunan interval kepercayaan 95% untuk memperkirakan nilai rata-rata y (biaya airline) untuk biaya maskapai misalnya ketika x (jumlah penumpang) adalah 73. Untuk interval kepercayaan 95%, sebuah

dan

. Dengan df = n-2 = 12-2 = 10. Tabel nilai t adalah t_.025,10=2.228. nilai lain yang dibutuhkan dalam masalah, yang diselesaikan untuk sebelumnya, adalah

Untuk x₀ = 73, nilai

adalah 4.5411. Selang kepercayaan menghitung untuk nilai rata-rata dari y, E (y₇₃), adalah

Artinya, dengan keyakinan 95% nilai rata-rata dari y untuk x = 73 adalah antara 4.4191 dan 4.6631.

Tabel 12.7 menunjukkan interval kepercayaan dihitung untuk biaya maskapai contoh bagi nilai-nilai beberapa wakil dari x untuk memperkirakan nilai rata-rata dari y. Perhatikan bahwa x nilai mendapatkan lebih jauh dari rata-rata nilai x (77.5), interval kepercayaan semakin luas; sebagai x nilai lebih dekat dengan mean, kepercayaan interval sempit. Alasannya adalah bahwa pembilang dari istilah kedua di bawah tanda radikal mendekati nol sebagai nilai x mendekati mean dan meningkat sebagai x berangkat dari mean.

Prediction Intervals to Estimate a Single Value of y

Tipe kedua dari interval dalam estimasi regresi interval prediksi untuk memperkirakan nilai tunggal dari y untuk nilai tertentu x.

Formula 12.7 hampir sama dengan rumus 12.6, kecuali untuk nilai tambahan 1 di bawah radikal. Nilai tambah ini memperlebar interval prediksi untuk memperkirakan nilai tunggal y dari interval kepercayaan untuk memperkirakan nilai rata-rata y. Hasil ini tampaknya logis karena nilai rata-rata y adalah menuju tengah sekelompok nilai y. Dengan demikian selang kepercayaan untuk memperkirakan rata-rata tidak perlu selebar interval prediksi yang dihasilkan oleh rumus 12.7, yang memperhitungkan semua nilai y untuk x yang diberikan.

Interval prediksi 95% dapat dihitung untuk memperkirakan nilai tunggal y untuk x = 73 dari biaya maskapai misalnya dengan menggunakan rumus 12.7. Nilai-nilai yang sama digunakan untuk membangun interval kepercayaan untuk memperkirakan nilai rata-rata dari y yang digunakan di sini.

Untuk x₀ = 73, nilai

= 4.5411. Prediksi interval komputasi untuk nilai tunggal y adalah

Prediksi interval dapat diperoleh dengan menggunakan komputer. Ditunjukkan dalam Gambar 12.15 adalah output komputer untuk contoh biaya maskapa. Output menampilkan nilai prediksi untuk x = 73 (

= 4.5411), interval kepercayaan 95% untuk nilai rata-rata dari y untuk x = 73, dan interval prediksi 95% untuk nilai tunggal dari y untuk x= 73. Catatan bahwa nilai-nilai yang dihasilkan hampir sama dengan yang dihitung dalam bagian ini.

Pemeriksaan rumus interval prediksi untuk memperkirakan y untuk nilai tertentu x menjelaskan mengapa interval sukar keluar.

Seperti kita memasukkan nilai-nilai yang berbeda dari x₀ dari analisis regresi ke dalam persamaan, satu-satunya hal yang berubah dalam persamaan adalah (x₀ -

)². Ungkapan ini meningkatkan nilai-nilai individu x₀mendapatkan lebih jauh dari rata-rata, sehingga peningkatan lebar interval. interval sempit untuk nilai x₀ dekat x dan luas untuk nilai x₀ jauh dari x. Perbandingan formula 12.6 dan 12.7 mengungkapkan mereka untuk menjadi identik kecuali formula yang 12.7 untuk menghitung interval prediksi untuk memperkirakan y untuk nilai tertentu x-mengandung 1 di bawah tanda radikal. perbedaan ini memastikan bahwa formula 12.7 akan menghasilkan interval lebih lebar dari 12.6 untuk data yang dinyatakan identik.

H.    Menggunakan Regresi Untuk Pengembangan Peramalan Trend Line

Peneliti bisnis sering menggunakan data historis dengan langkah-langkah yang diambil dari waktu ke waktu dalam upaya untuk meramalkan apa yang mungkin terjadi di masa depan. Sebuah jenis tertentu dari data yang sering cocok untuk analisis ini adalah data time-series didefinisikan sebagai data yang dikumpulkan pada karakteristik tertentu selama periode waktu secara berkala. Beberapa contoh data time-series adalah 10 tahun mingguan Dow Jones Industrial Averages, dua belas bulan dari produksi minyak harian, atau bulanan konsumsi kopi selama dua tahun. Untuk menjadi berguna untuk peramal, pengukuran time-series perlu dibuat dalam interval waktu yang teratur dan diatur sesuai dengan waktu kejadian. Seperti contoh, mempertimbangkan data penjualan time-series selama periode waktu 10 tahun untuk Huntsville Chemical Company ditunjukkan pada Tabel 12.8. Perhatikan bahwa pengukuran (penjualan) diambil dari waktu ke waktu dan bahwa angka penjualan yang diberikan secara tahunan. data time-series dapat juga dilaporkan harian, mingguan, bulanan, triwulanan, semesteran, atau untuk periode waktu pasti lainnya.

               Hal ini umumnya dipercaya bahwa data time-series mengandung satu atau kombinasi dari empat elemen : trend, cyclicality, seasonality, dan irregularity. masing-masing empat elemen ini akan dibahas dalam kesepakatan yang lebih besar dalam Bab 15, Time - Series Forecasting dan Indeks Nomor, di sini kita memeriksa tren dan mendefinisikannya sebagai arah umum data jangka panjang. Mengamati plot pencar dari data penjualan Huntsville Chemical Company ditunjukkan dalam Gambar 12.17, jelas bahwa ada tren positif dalam data. Artinya , tampaknya ada yang menjadi atas arah umum jangka panjang dari penjualan dari waktu ke waktu. Bagaimana tren dinyatakan dalam istilah matematika ? Di bidang peramalan, itu adalah umum untuk mencoba agar sesuai garis tren melalui data time - series dengan menentukan persamaan garis tren dan kemudian menggunakan persamaan garis tren untuk memprediksi titik data masa depan.

Menentukan Persamaan Garis Trend

               Mengembangkan persamaan garis tren linear dalam peramalan sebenarnya merupakan kasus khusus dari regresi sederhana dimana variabel y atau tergantung adalah variabel bunga yang bisnis Analis ingin untuk meramalkan dan untuk yang satu set pengukuran telah mengambil alih periode waktu. Misalnya, dengan data Huntsville Kimia Company, jika perusahaan peramal ingin memprediksi penjualan untuk tahun 2012 menggunakan data ini, penjualan akan menjadi variabel dependen dalam analisis regresi sederhana. Dalam analisis trend linear, waktu periode digunakan sebagai x, variabel independen atau prediktor, dalam analisis untuk menentukan persamaan garis tren. Dalam kasus Huntsville Chemical Company, variabel x merupakan tahun 2000-2009.

               Menggunakan penjualan sebagai variabel y dan waktu (tahun) sebagai variabel x, persamaan garis tren dapat dihitung dengan cara yang biasa seperti yang ditunjukkan pada Tabel 12.9 dan bertekad untuk menjadi: ŷ = -5,320.56 + 2,6687 x. Kurva, 2,6687, berarti bahwa untuk setiap kenaikan di waktu tahunan, penjualan meningkat dengan rata-rata $ 2,6687 (juta). mencegat akan mewakili penjualan perusahaan pada tahun 0 yang, tentu saja, dalam masalah ini tidak ada artinya karena Huntsville Chemical Company tidak eksis di tahun 0.

Peramalan Menggunakan Persamaan  Trend Line

               Penggunaan utama dari persamaan garis tren oleh analis bisnis untuk hasil peramalan untuk periode waktu di masa depan. Ingat hati-hati dari Bagian 12,8 yang menggunakan regresi Model untuk memprediksi nilai y untuk nilai-nilai x di luar domain yang digunakan untuk mengembangkan model mungkin tidak valid. Meskipun peringatan ini dan memahami kelemahan potensial, bisnis peramal meskipun demikian ekstrapolasi garis tren di luar paling periode waktu saat ini Data dan upaya untuk memprediksi hasil untuk jangka waktu di masa depan. Untuk meramalkan masa depan periode waktu menggunakan garis tren, masukkan jangka waktu yang menarik ke dalam persamaan garis tren dan memecahkan y. Misalnya, peramal untuk Huntsville Chemicals

               Perusahaan ingin memprediksi penjualan untuk tahun 2012 dengan menggunakan persamaan garis tren dikembangkan dari data time series historis mereka. Mengganti x dalam persamaan garis tren penjualan dengan 2012, menghasilkan perkiraan $ 40,85 (juta):

ŷ (2012) = -5,328.57 + 2,6687 (2012) = 40,85

Coding alternatif untuk Periode Waktu

               Jika Anda secara manual menghitung persamaan garis tren saat periode waktu yang bertahun-tahun, Anda melihat bahwa perhitungan bisa mendapatkan cukup besar dan rumit (amati Tabel 12.9). Namun, jika tahun yang berturut-turut, mereka dapat terekam menggunakan banyak perbedaan mungkin skema dan masih menghasilkan persamaan yang berarti trend line (meskipun y intercept berbeda nilai). Misalnya, alih-alih menggunakan tahun 2000-2009, misalkan kita menggunakan tahun 1 sampai 10. Artinya, 2000 = 1 (tahun pertama) 2001 = 2, 2002 = 3, dan seterusnya, hingga 2009 = 10. Hal ini merekam skema menghasilkan persamaan garis tren dari: ŷ = 6,1632 + 2.6687x seperti yang ditunjukkan pada Tabel 12.10.

               Perhatikan bahwa kemiringan garis tren adalah sama apakah tahun 2000 sampai 2009 adalah digunakan atau rekaman tahun  dari 1 sampai 10, tapi y intercept (6,1632) berbeda. Hal ini perlu harus dipertimbangkan ketika menggunakan persamaan garis trend untuk peramalan. Sejak persamaan tren baru berasal dari data recoded, perkiraan juga akan perlu dibuat menggunakan data rekaman. Misalnya, menggunakan sistem rekaman dari 1 sampai 10 untuk mewakili "Tahun," rekaman tahun 2012 sebagai 13 (2009 = 10, 2010 = 11, 2011 = 12, dan 2012 = 13). Memasukkan nilai ini ke dalam hasil persamaan trend line dalam perkiraan $ 40,86, sama dengan Nilai yang diperoleh dengan menggunakan tahun mentah sebagai waktu.

ŷ = 6,1632 + 2.6687x = 6,1632 + 2,6687 (13) = $ 40,86 (juta).

               Skema waktu rekaman sama dapat digunakan dalam perhitungan persamaan garis tren jika variabel waktu adalah sesuatu selain tahun. Misalnya, dalam kasus bulanan data time series, periode waktu dapat direkam sebagai: Januari = 1, Februari = 2, Maret = 3, Á, Desember = 12.

               Dalam kasus data kuartalan selama dua tahun, periode waktu dapat recoded

dengan skema seperti:

I.       Interpretasi Hasil (Output)

               Meskipun perhitungan manual dapat dilakukan, sebagian besar masalah regresi dianalisis oleh menggunakan komputer. Pada bagian ini, output komputer dari Excel akan disajikan dan dibahas.

               Berikutnya adalah tabel yang menggambarkan model secara lebih rinci. "Koe" singkatan koefisien istilah regresi. Koefisien Jumlah Penumpang, variabel x, adalah 0,040702. Nilai ini sama dengan kemiringan garis regresi dan tercermin dalam persamaan regresi. Koefisien ditampilkan di samping istilah konstan (1,5698) adalah nilai konstanta, yang merupakan y intercept dan juga merupakan bagian dari persamaan regresi. "T" nilai-nilai uji t untuk kurva dan uji t untuk mencegat atau konstan. (Kami umumnya tidak menafsirkan uji t untuk konstan.) t nilai untuk kurva, t = 9.44 dengan probabilitas terkait 0,000, sama dengan nilai yang diperoleh secara manual di bagian 12,7. Karena probabilitas nilai t diberikan, metode p-value dapat digunakan untuk menafsirkan nilai t.

               Baris berikutnya output adalah standard error dari estimasi se, S = 0.177217; koefisien determinasi, r 2, R-Sq = 89,9%; dan nilai disesuaikan r 2, R-Sq (adj) = 88,9%. (Adjusted r 2 akan dibahas dalam Bab 13.) Berikut barang-barang ini adalah analisis varian meja. Perhatikan bahwa nilai F = 89,09 digunakan untuk menguji keseluruhan model regresi garis. Item akhir dari output adalah nilai prediksi dan sesuai sisa untuk setiap pasangan poin. Meskipun output regresi Excel, yang ditunjukkan pada Gambar 12.21 untuk Demonstrasi Soal 12.1, Persamaan regresi ditemukan di bawah Koefisien di bagian bawah ANOVA. Kemiringan atau koefisien x adalah 2,2315 dan y-intercept adalah 30,9125. Standar error dari estimasi untuk masalah sakit diberikan sebagai statistik keempat di bawah Statistik regresi di atas output, Standar Error = 15,6491. R 2 nilai adalah diberikan sebagai 0,886 pada baris kedua. Uji t untuk kurva ditemukan di bawah t Stat dekat bagian bawah dari bagian ANOVA pada "Jumlah Tempat Tidur" (x variabel) berturut-turut, t = 8.83. berdekatan dengan t Stat adalah P-nilai, yang merupakan probabilitas dari statistik t terjadi secara kebetulan jika hipotesis nol benar. Untuk kemiringan ini, probabilitas yang ditampilkan adalah 0,000005. ANOVA tabel adalah di tengah-tengah output dengan nilai F memiliki probabilitas yang sama dengan t statistik, 0.000005, dan menyamai t 2. nilai-nilai yang diprediksi dan residual yang ditampilkan dalam Sisa bagian Output.

J. Studi Kasus

DELTA WIRE MENGGUNAAN PELATIHAN SEBAGAI SENJATA

               Delta Wire Corporation didirikan pada tahun 1978 di Clarksdale, Mississippi. Perusahaan memproduksi karbon tinggi kawat baja khusus untuk pasar global dan saat ini mempekerjakan sekitar 100 orang. Selama beberapa tahun terakhir, penjualan meningkat setiap tahun.

               Beberapa tahun yang lalu, hal-hal tidak terlihat cerah bagi Delta Wire karena tertangkap dalam potensi bencana mengikat. Dengan penurunan nilai dolar, persaingan asing itu menjadi ancaman untuk posisi pasar Delta. Selain kompetisi asing, kualitas industri yang berkembang Persyaratan itu menjadi lebih keras setiap tahun. Pejabat Delta menyadari bahwa beberapa kondisi, seperti nilai dolar, berada di luar kendali mereka. Namun, salah satu daerah yang mereka bisa memperbaiki adalah pendidikan karyawan. Perusahaan ini bekerja sama dengan program pelatihan yang dikembangkan oleh negara bagian Mississippi dan perguruan tinggi setempat untuk mengatur sekolah sendiri. karyawan Delta diperkenalkan ke statistik pengendalian proses dan teknik jaminan mutu lainnya. Delta meyakinkan pelanggan bahwa perusahaan bekerja keras pada meningkatkan kualitas dan tetap kompetitif. pelanggan yang diundang untuk duduk di pada sesi pendidikan. Karena ini usaha, Delta telah mampu cuaca badai dan terus untuk mempertahankan posisi kepemimpinan dalam baja yang sangat kompetitif industri kawat.

               Delta melanjutkan program pelatihan dan pendidikannya. Di tahun 1990-an, Delta melembagakan program pelatihan keterampilan dasar yang akhirnya menyebabkan penurunan bahan yang tidak sesuai dari 6% menjadi 2% dan peningkatan produktivitas dari 70.000 90.000 pound per minggu. Selain itu, inisiatif ini menghasilkan "terbaik di kelasnya" penghargaan dari Goodyear, pelanggan yang terbesar.

               Meskipun diakuisisi oleh Bekaert dari Belgia pada bulan Januari 2006, Delta Wire Corporation, pemasok utama manik kawat untuk penguatan ban dan produk kawat khusus lainnya untuk pasar Amerika Utara, terus beroperasi di kapasitas saat ini. Bekaert ingin mendukung Delta Wire pertumbuhan pangsa pasar dan menjamin ketersediaan produk yang memadai kepada pelanggan.

Diskusi

1.      Delta Wire membanggakan diri pada upaya di bidang pendidikan karyawan. pendidikan karyawan dapat membayar dalam banyak jalan. Membahas beberapa dari mereka. Salah satu hasil dapat minat baru dan kegembiraan yang dihasilkan terhadap pekerjaan dan perusahaan. Beberapa orang berteori bahwa karena pandangan yang lebih positif dan minat menerapkan hal belajar, pendidikan yang lebih yang diterima oleh pekerja, semakin kecil kemungkinan ia untuk melewatkan hari kerja. Misalkan data berikut mewakili para jumlah hari cuti sakit yang diambil oleh 20 pekerja terakhir tahun bersama dengan jumlah jam kontak karyawan pendidikan / pelatihan yang mereka masing-masing menerima dalam tahun lalu. Gunakan teknik belajar dalam bab ini untuk menganalisis data. Mencakup baik regresi dan korelasi teknik. Diskusikan kekuatan hubungan dan setiap model yang dikembangkan.

2.      Banyak perusahaan menemukan bahwa pelaksanaan total manajemen mutu akhirnya menghasilkan peningkatan penjualan. Perusahaan yang gagal untuk mengadopsi upaya kualitas kehilangan pangsa pasar dalam banyak kasus atau pergi keluar dari bisnis. Satu mengukur efek dari peningkatan kualitas perusahaan upaya adalah kepuasan pelanggan. Misalkan Delta Wire menyewa sebuah perusahaan riset untuk mengukur kepuasan pelanggan setiap tahun. Perusahaan riset dikembangkan pelanggan skala kepuasan di mana pelanggan benar-benar puas dapat penghargaan nilai setinggi 50 dan benar-benar pelanggan puas bisa skor penghargaan serendah 0. Skor yang diukur dari banyak pelanggan industri yang berbeda dan rata-rata untuk skor pelanggan rata-rata tahunan. Apakah melakukan peningkatan penjualan berkaitan peningkatan nilai kepuasan pelanggan? Untuk mempelajari gagasan ini, misalkan kepuasan pelanggan rata-rata skor setiap tahun untuk Delta wire dipasangkan dengan total penjualan perseroan tahun itu untuk 15 tahun terakhir, dan analisis regresi dijalankan pada data. Asumsikan berikut adalah Excel output. Misalkan Anda diminta oleh Delta Wire untuk menganalisis data dan meringkas hasil. Apa yang akan kamu temukan?

3.      Delta Wire peningkatan produktivitas dari 70.000 ke 90.000 pound per minggu selama waktu ketika melembagakan dasar keterampilan program pelatihan . Misalkan program ini dilaksanakan selama 18 bulan dan bahwa berikut data jumlah total kumulatif keterampilan jam dasar pelatihan dan per minggu angka produktivitas diambil sebulan sekali selama waktu ini. Gunakan teknik dari ini bab untuk menganalisis data dan membuat laporan singkat untuk Delta tentang prediktabilitas produktivitas dari kumulatif jam pelatihan .

Situs Berbagi Informasi

Rabu, 22 Juni 2016

Regresi dan Model Korelasi Sederhana

Tidak ada komentar:

Posting Komentar