Dalam bab ini, kami
mengeksplorasi teknik untuk menganalisis data kategori. Data kategori adalah
data non numerik yang jumlah frekuensi kategori dari satu atau lebih variabel.
Teknik-teknik yang disajikan di sini untuk menganalisis data kategori, the chi-square goodness-of-fit test dan the
chi-square test of independence, adalah hasil dari distribusi binomial dan
teknik inferensial untuk menganalisis proporsi populasi.
A. Chi-Square
Goodness-of-Fit Test16.1
Sebelumnya
kita telah mempelajari distribusi binomial di mana hanya dua kemungkinan hasil
yang bisa terjadi pada percobaan tunggal dalam eksperimen. Perluasan dari distribusi
binomial adalah distribusi multinomial di mana lebih dari dua hasil yang
mungkin dapat terjadi dalam percobaan tunggal. The chi-square goodness-of-fit
test digunakan untuk menganalisis probabilitas uji coba distribusi multinomial
sepanjang satu dimensi.
The
chi-square goodness-of-fit test membandingkan harapan, atau teoritis, frekuensi
kategori dari distribusi populasi yang diamati, atau sebenarnya, frekuensi dari
distribusi untuk menentukan apakah ada perbedaan antara apa yang diharapkan dan
apa yang diamati.
Formula yang digunakan
untuk menghitung uji goodness of fit test : Chi Square

x2= uji statistic chi
square
fo = frekuensi
nilai-nilai yang diamati
fe = frekuensi
nilai-nilai yang diharapkan
k = jumlah kategori
c = jumlah parameter
yang diestimasi dari data sampel
Formula
ini membandingkan frekuensi nilai-nilai yang diamati dengan frekuensi dari
nilai-nilai yang diharapkan di distribusi. Tes kehilangan satu derajat
kebebasan karena jumlah total frekuensi yang diharapkan harus sama dengan
jumlah frekuensi yang diamati; yaitu, total diamati diambil dari sampel
digunakan sebagai total untuk frekuensi yang diharapkan. Selain itu, dalam
beberapa kasus parameter populasi, seperti
,
, atau
, diperkirakan dari data sampel
untuk menentukan distribusi frekuensi nilai-nilai yang diharapkan. Setiap kali
estimasi ini terjadi, gelar tambahan kebebasan hilang. Sebagai aturan, jika
distribusi seragam yang digunakan sebagai distribusi yang diharapkan atau jika
distribusi yang diharapkan dari nilai-nilai yang diberikan, k - 1 derajat kebebasan yang digunakan
dalam ujian. Dalam pengujian untuk menentukan apakah distribusi yang diamati
adalah Poisson, derajat kebebasan adalah k
- 2 karena gelar tambahan kebebasan hilang dalam memperkirakan l. Dalam pengujian
untuk menentukan apakah distribusi yang diamati adalah normal, derajat
kebebasan adalah k - 3 karena dua
derajat tambahan kebebasan hilang dalam memperkirakan kedua
dan
dari data sampel yang diamati.





Karl
Pearson memperkenalkan uji chi-square pada tahun 1900. Distribusi chi-square
adalah jumlah kuadrat dari k variabel
acak independen dan karena itu tidak pernah bisa kurang dari nol; meluas tanpa
batas ke arah yang positif. Sebenarnya distribusi chi-square merupakan
keluarga, dengan masing-masing distribusi ditentukan oleh derajat kebebasan
(df) yang terkait dengan itu. Untuk nilai df kecil distribusi chi-square miring
jauh ke kanan (nilai positif). Sebagai peningkatan df, distribusi chi-square
mulai mendekati kurva normal. Karena keterbatasan ruang, nilai chi-square
tercantum hanya untuk probabilitas tertentu.
Contoh
Perusahaan
susu ingin tahu apakah penjualan susu didistribusikan secara merata selama
setahun sehingga mereka dapat merencanakan untuk produksi susu dan penyimpanan.
Sebuah distribusi seragam berarti bahwa frekuensi adalah sama di semua
kategori. Dalam situasi ini, para produsen mencoba untuk menentukan apakah
jumlah susu yang dijual adalah sama untuk setiap bulan dalam setahun. Mereka
memastikan jumlah galon susu yang dijual dengan sampling upermarket setiap
bulan selama setahun, memperoleh data berikut.

Gunakan
= 0.01 untuk menguji apakah data
cocok dengan distribusi seragam.

Jawab
Langkah 1.
H0 : Angka
bulanan untuk penjualan susu terdistribusi secara merata.
Ha : Angka
bulanan untuk penjualan susu tidak terdistribusi secara merata.
Langkah 2. Uji
statistik yang digunakan adalah

Langkah 3. 

Langkah 4. Ada 12
kategori dan distribusi seragam adalah distribusi yang diharapkan, sehingga
derajat kebebasan adalah k - 1 = 12 -
1 = 11. Untuk
= 0.01, nilai kritis adalah x20.01,11 =
24,725. Nilai chi-square diamati lebih dari 24,725 harus diperoleh untuk
menolak hipotesis nol.

Langkah 5. Data yang
diberikan dalam tabel sebelumnya.
Langkah 6. Langkah
pertama dalam menghitung statistik uji adalah untuk menentukan frekuensi yang
diharapkan. Total untuk frekuensi yang diharapkan harus sama total untuk
frekuensi yang diamati (18.447). Jika frekuensi didistribusikan merata, jumlah
yang sama dari galon susu diperkirakan akan dijual setiap bulan. Angka bulanan
yang diharapkan adalah

Tabel berikut
menunjukkan frekuensi yang diamati, frekuensi yang diharapkan, dan perhitungan
chi-square untuk masalah ini.

Langkah
7. Nilai x2 yang diamati dari 74,37 lebih besar dari nilai tabel
kritis x20.01,11=
24,725, sehingga keputusan ini adalah untuk menolak hipotesis nol. Masalah ini
memberikan bukti yang cukup untuk menunjukkan bahwa distribusi penjualan susu
tidak seragam.
Dengan
menggunakan excel

IMPLIKASI
BISNIS:
Langkah
8. Karena permintaan susu ritel tidak terdistribusi secara merata, penjualan
dan manajer produksi perlu untuk menghasilkan rencana produksi untuk mengatasi
permintaan yang tidak rata. Dalam masa permintaan berat, lebih banyak susu akan
perlu diproses atau cadangan; pada saat permintaan kurang, penyediaan untuk
penyimpanan susu atau untuk pengurangan pembelian susu dari peternak sapi perah
akan diperlukan.

B. Uji Independensi Chi-Square
Uji independensi (uji kebebasan)
ini digunakan untuk memeriksa kebebasan atau independensi dari dua variabel
(frekuensi observasi dan frekuensi harapan) sehingga kita dapat menyimpulkan
apakah kedua peubah tersebut saling bebas (tidak berpengaruh) ataukah keduanya
saling bertalian (berpengaruh).
Data untuk menguji kebebasan
dua variabel tersebut disajikan dalam bentuk tabel kontingensi atau tabel berkemungkinan
yang umumnya berukuran r baris x k kolom. Sebelum melakukan pengujian, terlebih
dahulu kita harus mendefinisikan hipotesis awal (Ho) dan hipotesis alternatif
(H1), yaitu:
Ho
: variabel-variabel saling bebas
H1
: variabel-variabel tidak saling bebas
Biasanya tabel kontingensi
berisikan data berupa frekuensi observasi yang diperoleh dari suatu pengujian.
Untuk itu, kita perlu mencari frekuensi ekspektasi terlebih dahulu sebelum
melakukan pengujian.

Contoh:
Sebuah lembaga penelitian
tertarik untuk mengadakan penelitian terhadap pemirsa televisi. Acara televisi
dapat dikelompokkan sebagai infotaiment, sinetron, dan berita. Peneliti
tertarik untuk mengetahui apakah pemirsa dipengaruhi oleh usia yaitu anak,
remaja, dan dewasa. Untuk keperluan penelitian, telah diambil sampel sebanyak
400 orang telah disusun tabel kontingensi seperti ditunjukkan dalam gambar
berikut ini:

Apakah terdapat hubungan antara dua faktor
tersebut?
Langkah 1: Menghitung nilai harapan (expected value) dari observasi yang
telah dilakukan. Bentuk tabel nilai harapan pada dasarnya sama dengan tabel
observasi. Susun rumus pada alamat sel C12 yaitu =($F5*C$8)/$F$8. Salin rumus
tersebut dan hasil ditempatkan dalam range C12:E14.
![]() |
Langkah 2: Lakukan perhitungan berikut ini,
·
Probabilitas pada alamat sel D20 dengan menyusun atau menulis fungsi
=CHITEST(C5:E7;C12:E14).
·
Chi-square hitung (D21) dengan fungsi =CHIINV(D20;D18).
·
Chi-square tabel (D22) dengan fungsi =CHIINV(D17;D18). Anda perhatikan,
nilai df – degree of freedom (D18) adalah 4 yaitu berasal dari tabel yang
berjumlah tiga kolom dan tiga baris dengan hitungan df = (3-1) x (3-1). Atau
rumusan (jumlah kolom-1) x (jumlah baris-1).

Langkah 3: Membuat kesimpulan dengan cara,
·
Membandingkan
hitung
tabel (sel E25) dengan menyusun fungsi
=IF(D21>D22;”Ho DITOLAK”;”Ho DITERIMA”).


·
Melihat nilai
probabilitas (P-value) – sel E26 dengan menyusun fungsi =IF(D20>D17;”Ho
DITERIMA”;”Ho DITOLAK”).

Kesimpulan tersebut berdasarkan:
·
Hipotesis untuk kasus chi-square adalah:
Ho
: p11 = p12... = p33
Artinya,
tabel kontingensi di atas adalah independen atau pemirsa acara televisi tidak
tergantung pada kelompok usia.
H1 : p11 ≠ p12... ≠ p33
Artinya,
tabel kontingensi di atas adalah dependen atau pemirsa acara televisi
tergantung pada kelompok usia. Contoh, acara infotaiment lebih disukai oleh
anak-anak, sedangkan berita lebih disukai oleh orang dewasa dan sebagainya.
·
Pengambilan keputusan yaitu berdasarkan:
ü
Membandingkan
hitung
tabel mengacu pada ketentuan:


Jika
hitung >
tabel, Ho ditolak


Jika
hitung <
tabel, Ho diterima


Berdasarkan hasil data, ternyata
hitung adalah 19,49
(sel D21) lebih besar dari
tabel yaitu sebesar
9,49 (sel D22) sehingga Ho ditolak. Artinya, ada ketergantungan antara kelompok
usia pemirsa dengan jenis acara televisi yang ditontonnya.


ü Melihat
nilai probabilitasnya (P-value) yang mengacu pada ketentuan:
Jika probabilitas > 0,05, Ho diterima
Jika probabilitas < 0,05, Ho ditolak
Nilai probabilitas (P-value) dalam kasus
ini adalah 0,00063 (sel D20) lebih kecil dari 0,05 sehingga Ho ditolak.
Artinya, kelompok usia pemirsa mempengaruhi jenis acara televisi yang ditonton.
C. Study Kasus
FOOT LOCKER IN THE SHOE MIX
Foot Locker , Inc. , adalah nomor satu pengecer di dunia atletik alas kaki dan pakaian . Perusahaan ini memiliki sekitar 3.800 toko ritel di 21 negara di seluruh Amerika Utara, Eropa, dan Australia dengan berbagai nama merek. diperkirakan Foot Locker menguasai sekitar 18 % dari $ 15000000000 pasar alas kaki atletik AS. Perusahaan bermaksud untuk meningkatkan pangsa pasar di seluruh dunia dengan menambahkan toko tambahan dan dengan menumbuhkan Internet dan katalog bisnisnya. Dalam beberapa tahun terakhir , para pejabat Foot Locker telah memikirkan kembali bauran ritel perusahaan . Menentukan campuran sepatu yang akan memaksimalkan keuntungan adalah sebuah keputusan penting untuk Foot Locker . Oleh Pada tahun 2002, dalam upaya untuk mengurangi persediaan harga sepatu, perusahaan telah mengurangi persediaan sepatu kets dengan harga $ 120 atau lebih sebesar 50 % .
Diskusi
Misalkan data yang disajikan di bawah ini mewakili jumlah penjualan unit ( juta $ ) untuk alas kaki atletik di tahun 2000 dan 2009. Penggunaan teknik yang disajikan dalam bab ini untuk menganalisa Data dan mendiskusikan implikasi bisnis untuk Foot Locker .

Misalkan Foot Locker sangat mendorong karyawannya untuk membuat saran formal untuk meningkatkan toko, produk, dan lingkungan kerja. Misalkan auditor kualitas terus mencatat saran, orang-orang yang diajukan mereka, dan wilayah geografis dari mana mereka datang. Kemungkinan rincian jumlah saran selama periode 3 tahun berdasarkan jenis kelamin karyawan dan lokasi geografis berikut. Apakah ada hubungan antara jenis kelamin karyawan dan geografis Lokasi dari segi jumlah saran ? Jika mereka terkait, apa hubungan ini untuk perusahaan? Apa implikasi bisnis mungkin ada untuk analisis seperti itu?

Menurut Wells Fargo Securities Dan NPDFashionworld consumer panel, Foot Locker memegang 19,4 % Dari Pasar sneaker. Misalkan karena hubungannya dengan Nike dan kehadiran Nike di wilâyah AS Barat, Foot Locker percaya bahwa pangsa Pasar di Wilayah yang lebih tinggi daripada di seluruh negeri. Foot Locker menyewa sebiah Pasar Perusahaan Riset untuk review Menguji gagasan ini. Perusahaan Riset mengambil sampel acak 1.000 orang di U.S.West Yang baru Saja Membeli Sepasang sepatu kets dan 230 dari pembeli sampel. Dibeli sepatu mereka di Foot Locker. Apakah hasil temuan cukup bukti untuk menyatakan bahwa pangsa Foot Locker untuk review Pasar di AS Barat beroperasi signifikan lebih tinggi daripada sebaliknya ? Gunakan teknik dari bab ini untuk menguji hipotesis ini. Apa implikasi bisnis yang mungkin ada untuk review Foot Locker jika Informasi pangsa Pasar Benar ?
Jawab :
·
Langkah
1.
H0 : Terdapat
Hubungan Kategori harga dengan penjualan tahun 2000 dan 2009
Ha : Tidak terdapat
hubungan Kategori harga dengan penjualan tahun 2000 dan 2009
·
Langkah 2 ; Menghitung Chi Square Tabel dan Chi Square
Hitung dengan menggunakan Excel
·
Langkah 3 :
Membandingkan Chi Square Hitung dan Chi Square Tabel

Karena Nilai Chi Square hitung (0,855) < jika dibandingkan
dengaan Chi Square Tabel (14,067), maka Ho diterima
·
Langkah 4 : Kesimpulan
Karena Ho diterima, maka terdapat hubungan kategori harga
dengan penjualan tahun 2000 da 2009
·
Langkah
1.
H0 : Terdapat
Hubungan Lokasi Geografi dengan jenis Kelamin
Ha : Tidak
terdapat Hubungan Lokasi Geografi dengan jenis Kelamin
·
Langkah 2 ; Menghitung Chi Square Tabel dan Chi Square
Hitung dengan menggunakan Excel

·
Langkah 3 : Membandingkan Chi Square Hitung dan Chi
Square Tabel
Karena Nilai Chi Square hitung (31,206) > jika
dibandingkan dengaan Chi Square Tabel (11,070), maka Ho ditolak
·
Langkah 4 : Kesimpulan
Karena Ho ditolak, maka tidak terdapat hubungan lokasi
geografis dengan jenis kelamin
Tidak ada komentar:
Posting Komentar