Rabu, 22 Juni 2016

Data Kategori (Statistika Bisnis)



Dalam bab ini, kami mengeksplorasi teknik untuk menganalisis data kategori. Data kategori adalah data non numerik yang jumlah frekuensi kategori dari satu atau lebih variabel. Teknik-teknik yang disajikan di sini untuk menganalisis data kategori, the chi-square goodness-of-fit test dan the chi-square test of independence, adalah hasil dari distribusi binomial dan teknik inferensial untuk menganalisis proporsi populasi.
A.     Chi-Square Goodness-of-Fit Test16.1
Sebelumnya kita telah mempelajari distribusi binomial di mana hanya dua kemungkinan hasil yang bisa terjadi pada percobaan tunggal dalam eksperimen. Perluasan dari distribusi binomial adalah distribusi multinomial di mana lebih dari dua hasil yang mungkin dapat terjadi dalam percobaan tunggal. The chi-square goodness-of-fit test digunakan untuk menganalisis probabilitas uji coba distribusi multinomial sepanjang satu dimensi.
The chi-square goodness-of-fit test membandingkan harapan, atau teoritis, frekuensi kategori dari distribusi populasi yang diamati, atau sebenarnya, frekuensi dari distribusi untuk menentukan apakah ada perbedaan antara apa yang diharapkan dan apa yang diamati.
Formula yang digunakan untuk menghitung uji goodness of fit test : Chi Square

x2= uji statistic chi square
fo = frekuensi nilai-nilai yang diamati
fe = frekuensi nilai-nilai yang diharapkan
k = jumlah kategori
c = jumlah parameter yang diestimasi dari data sampel

Formula ini membandingkan frekuensi nilai-nilai yang diamati dengan frekuensi dari nilai-nilai yang diharapkan di distribusi. Tes kehilangan satu derajat kebebasan karena jumlah total frekuensi yang diharapkan harus sama dengan jumlah frekuensi yang diamati; yaitu, total diamati diambil dari sampel digunakan sebagai total untuk frekuensi yang diharapkan. Selain itu, dalam beberapa kasus parameter populasi, seperti , , atau , diperkirakan dari data sampel untuk menentukan distribusi frekuensi nilai-nilai yang diharapkan. Setiap kali estimasi ini terjadi, gelar tambahan kebebasan hilang. Sebagai aturan, jika distribusi seragam yang digunakan sebagai distribusi yang diharapkan atau jika distribusi yang diharapkan dari nilai-nilai yang diberikan, k - 1 derajat kebebasan yang digunakan dalam ujian. Dalam pengujian untuk menentukan apakah distribusi yang diamati adalah Poisson, derajat kebebasan adalah k - 2 karena gelar tambahan kebebasan hilang dalam memperkirakan l. Dalam pengujian untuk menentukan apakah distribusi yang diamati adalah normal, derajat kebebasan adalah k - 3 karena dua derajat tambahan kebebasan hilang dalam memperkirakan kedua  dan  dari data sampel yang diamati.
Karl Pearson memperkenalkan uji chi-square pada tahun 1900. Distribusi chi-square adalah jumlah kuadrat dari k variabel acak independen dan karena itu tidak pernah bisa kurang dari nol; meluas tanpa batas ke arah yang positif. Sebenarnya distribusi chi-square merupakan keluarga, dengan masing-masing distribusi ditentukan oleh derajat kebebasan (df) yang terkait dengan itu. Untuk nilai df kecil distribusi chi-square miring jauh ke kanan (nilai positif). Sebagai peningkatan df, distribusi chi-square mulai mendekati kurva normal. Karena keterbatasan ruang, nilai chi-square tercantum hanya untuk probabilitas tertentu.
Contoh
Perusahaan susu ingin tahu apakah penjualan susu didistribusikan secara merata selama setahun sehingga mereka dapat merencanakan untuk produksi susu dan penyimpanan. Sebuah distribusi seragam berarti bahwa frekuensi adalah sama di semua kategori. Dalam situasi ini, para produsen mencoba untuk menentukan apakah jumlah susu yang dijual adalah sama untuk setiap bulan dalam setahun. Mereka memastikan jumlah galon susu yang dijual dengan sampling upermarket setiap bulan selama setahun, memperoleh data berikut.
Gunakan = 0.01 untuk menguji apakah data cocok dengan distribusi seragam.
Jawab
Langkah 1.
H0 : Angka bulanan untuk penjualan susu terdistribusi secara merata.
Ha : Angka bulanan untuk penjualan susu tidak terdistribusi secara merata.
Langkah 2. Uji statistik yang digunakan adalah
 
Langkah 3.
Langkah 4. Ada 12 kategori dan distribusi seragam adalah distribusi yang diharapkan, sehingga derajat kebebasan adalah k - 1 = 12 - 1 = 11. Untuk  = 0.01, nilai kritis adalah x20.01,11 = 24,725. Nilai chi-square diamati lebih dari 24,725 harus diperoleh untuk menolak hipotesis nol.
Langkah 5. Data yang diberikan dalam tabel sebelumnya.
Langkah 6. Langkah pertama dalam menghitung statistik uji adalah untuk menentukan frekuensi yang diharapkan. Total untuk frekuensi yang diharapkan harus sama total untuk frekuensi yang diamati (18.447). Jika frekuensi didistribusikan merata, jumlah yang sama dari galon susu diperkirakan akan dijual setiap bulan. Angka bulanan yang diharapkan adalah
Tabel berikut menunjukkan frekuensi yang diamati, frekuensi yang diharapkan, dan perhitungan chi-square untuk masalah ini.
Langkah 7. Nilai x2 yang diamati dari 74,37 lebih besar dari nilai tabel kritis x20.01,11= 24,725, sehingga keputusan ini adalah untuk menolak hipotesis nol. Masalah ini memberikan bukti yang cukup untuk menunjukkan bahwa distribusi penjualan susu tidak seragam.

Dengan menggunakan excel
IMPLIKASI BISNIS:
Langkah 8. Karena permintaan susu ritel tidak terdistribusi secara merata, penjualan dan manajer produksi perlu untuk menghasilkan rencana produksi untuk mengatasi permintaan yang tidak rata. Dalam masa permintaan berat, lebih banyak susu akan perlu diproses atau cadangan; pada saat permintaan kurang, penyediaan untuk penyimpanan susu atau untuk pengurangan pembelian susu dari peternak sapi perah akan diperlukan.

B.   Uji Independensi Chi-Square
Uji independensi (uji kebebasan) ini digunakan untuk memeriksa kebebasan atau independensi dari dua variabel (frekuensi observasi dan frekuensi harapan) sehingga kita dapat menyimpulkan apakah kedua peubah tersebut saling bebas (tidak berpengaruh) ataukah keduanya saling bertalian (berpengaruh).
Data untuk menguji kebebasan dua variabel tersebut disajikan dalam bentuk tabel kontingensi atau tabel berkemungkinan yang umumnya berukuran r baris x k kolom. Sebelum melakukan pengujian, terlebih dahulu kita harus mendefinisikan hipotesis awal (Ho) dan hipotesis alternatif (H1), yaitu:
Ho          : variabel-variabel saling bebas
H1          : variabel-variabel tidak saling bebas
Biasanya tabel kontingensi berisikan data berupa frekuensi observasi yang diperoleh dari suatu pengujian. Untuk itu, kita perlu mencari frekuensi ekspektasi terlebih dahulu sebelum melakukan pengujian.
c1.png
Contoh:
Sebuah lembaga penelitian tertarik untuk mengadakan penelitian terhadap pemirsa televisi. Acara televisi dapat dikelompokkan sebagai infotaiment, sinetron, dan berita. Peneliti tertarik untuk mengetahui apakah pemirsa dipengaruhi oleh usia yaitu anak, remaja, dan dewasa. Untuk keperluan penelitian, telah diambil sampel sebanyak 400 orang telah disusun tabel kontingensi seperti ditunjukkan dalam gambar berikut ini:
Untitled.png
Apakah terdapat hubungan antara dua faktor tersebut?
Langkah 1: Menghitung nilai harapan (expected value) dari observasi yang telah dilakukan. Bentuk tabel nilai harapan pada dasarnya sama dengan tabel observasi. Susun rumus pada alamat sel C12 yaitu =($F5*C$8)/$F$8. Salin rumus tersebut dan hasil ditempatkan dalam range C12:E14.


Untitled.png

Langkah 2: Lakukan perhitungan berikut ini,
·      Probabilitas pada alamat sel D20 dengan menyusun atau menulis fungsi =CHITEST(C5:E7;C12:E14).
·      Chi-square hitung (D21) dengan fungsi =CHIINV(D20;D18).
·      Chi-square tabel (D22) dengan fungsi =CHIINV(D17;D18). Anda perhatikan, nilai df – degree of freedom (D18) adalah 4 yaitu berasal dari tabel yang berjumlah tiga kolom dan tiga baris dengan hitungan df = (3-1) x (3-1). Atau rumusan (jumlah kolom-1) x (jumlah baris-1).

Untitled.png
Langkah 3: Membuat kesimpulan dengan cara,
·      Membandingkan  hitung  tabel (sel E25) dengan menyusun fungsi =IF(D21>D22;”Ho DITOLAK”;”Ho DITERIMA”).
·      Melihat nilai probabilitas (P-value) – sel E26 dengan menyusun fungsi =IF(D20>D17;”Ho DITERIMA”;”Ho DITOLAK”).

Kesimpulan tersebut berdasarkan:
·      Hipotesis untuk kasus chi-square adalah:
Ho : p11 = p12... = p33
Artinya, tabel kontingensi di atas adalah independen atau pemirsa acara televisi tidak tergantung pada kelompok usia.
H1 : p11 ≠ p12... ≠ p33
Artinya, tabel kontingensi di atas adalah dependen atau pemirsa acara televisi tergantung pada kelompok usia. Contoh, acara infotaiment lebih disukai oleh anak-anak, sedangkan berita lebih disukai oleh orang dewasa dan sebagainya.
·      Pengambilan keputusan yaitu berdasarkan:
ü Membandingkan  hitung  tabel mengacu pada ketentuan:
Jika  hitung >  tabel, Ho ditolak
Jika  hitung <  tabel, Ho diterima
Berdasarkan hasil data, ternyata  hitung adalah 19,49 (sel D21) lebih besar dari  tabel yaitu sebesar 9,49 (sel D22) sehingga Ho ditolak. Artinya, ada ketergantungan antara kelompok usia pemirsa dengan jenis acara televisi yang ditontonnya.
ü Melihat nilai probabilitasnya (P-value) yang mengacu pada ketentuan:
Jika probabilitas > 0,05, Ho diterima
Jika probabilitas < 0,05, Ho ditolak
Nilai probabilitas (P-value) dalam kasus ini adalah 0,00063 (sel D20) lebih kecil dari 0,05 sehingga Ho ditolak. Artinya, kelompok usia pemirsa mempengaruhi jenis acara televisi yang ditonton.

C.    Study Kasus
FOOT LOCKER IN THE SHOE MIX
         Foot Locker , Inc. , adalah nomor satu pengecer di dunia atletik alas kaki dan pakaian . Perusahaan ini memiliki sekitar 3.800 toko ritel di 21 negara di seluruh Amerika Utara, Eropa, dan Australia dengan berbagai nama merek. diperkirakan Foot Locker menguasai sekitar 18 % dari $ 15000000000 pasar alas kaki atletik AS. Perusahaan bermaksud untuk meningkatkan pangsa pasar di seluruh dunia dengan menambahkan toko tambahan dan dengan menumbuhkan Internet dan katalog bisnisnya. Dalam beberapa tahun terakhir , para pejabat Foot Locker telah memikirkan kembali bauran ritel perusahaan . Menentukan campuran sepatu yang akan memaksimalkan keuntungan adalah sebuah keputusan penting untuk Foot Locker . Oleh Pada tahun 2002, dalam upaya untuk mengurangi persediaan harga sepatu, perusahaan telah mengurangi persediaan sepatu kets dengan harga $ 120 atau lebih sebesar 50 % .
Diskusi
         Misalkan data yang disajikan di bawah ini mewakili jumlah penjualan unit ( juta $ ) untuk alas kaki atletik di tahun 2000 dan 2009. Penggunaan teknik yang disajikan dalam bab ini untuk menganalisa Data dan mendiskusikan implikasi bisnis untuk Foot Locker . 
         Misalkan Foot Locker sangat mendorong karyawannya untuk membuat saran formal untuk meningkatkan toko, produk, dan lingkungan kerja. Misalkan auditor kualitas terus mencatat saran, orang-orang yang diajukan mereka, dan wilayah geografis dari mana mereka datang. Kemungkinan rincian jumlah saran selama periode 3 tahun berdasarkan jenis kelamin karyawan dan lokasi geografis berikut. Apakah ada hubungan antara jenis kelamin karyawan dan geografis Lokasi dari segi jumlah saran ? Jika mereka terkait, apa hubungan ini untuk perusahaan? Apa implikasi bisnis mungkin ada untuk analisis seperti itu?
         Menurut Wells Fargo Securities Dan NPDFashionworld consumer panel, Foot Locker memegang 19,4 % Dari Pasar sneaker. Misalkan karena hubungannya dengan Nike dan kehadiran Nike di wilâyah AS Barat, Foot Locker percaya bahwa pangsa Pasar di Wilayah yang lebih tinggi daripada di seluruh negeri. Foot Locker menyewa sebiah Pasar Perusahaan Riset untuk review Menguji gagasan ini. Perusahaan Riset mengambil sampel acak 1.000 orang di U.S.West Yang baru Saja Membeli Sepasang sepatu kets dan 230 dari pembeli sampel. Dibeli sepatu mereka di Foot Locker. Apakah hasil temuan cukup bukti untuk menyatakan bahwa pangsa Foot Locker untuk review Pasar di AS Barat beroperasi signifikan lebih tinggi daripada sebaliknya ? Gunakan teknik dari bab ini untuk menguji hipotesis ini. Apa implikasi bisnis yang mungkin ada untuk review Foot Locker jika Informasi pangsa Pasar Benar ?
Jawab :
·         Langkah 1.
H0 : Terdapat Hubungan Kategori harga dengan penjualan tahun 2000 dan 2009
Ha : Tidak terdapat hubungan Kategori harga dengan penjualan tahun 2000 dan 2009
·         Langkah 2 ; Menghitung Chi Square Tabel dan Chi Square Hitung dengan menggunakan Excel

·         Langkah 3 : Membandingkan Chi Square Hitung dan Chi Square Tabel
Karena Nilai Chi Square hitung (0,855) < jika dibandingkan dengaan Chi Square Tabel (14,067), maka Ho diterima

·         Langkah 4 : Kesimpulan

Karena Ho diterima, maka terdapat hubungan kategori harga dengan  penjualan tahun 2000 da 2009




·         Langkah 1.
H0 : Terdapat Hubungan Lokasi Geografi dengan jenis Kelamin
Ha : Tidak terdapat Hubungan Lokasi Geografi dengan jenis Kelamin
·         Langkah 2 ; Menghitung Chi Square Tabel dan Chi Square Hitung dengan menggunakan Excel
·         Langkah 3 : Membandingkan Chi Square Hitung dan Chi Square Tabel
Karena Nilai Chi Square hitung (31,206) > jika dibandingkan dengaan Chi Square Tabel (11,070), maka Ho ditolak

·         Langkah 4 : Kesimpulan

Karena Ho ditolak, maka tidak terdapat hubungan lokasi geografis dengan jenis kelamin


Tidak ada komentar:

Posting Komentar