AUZEF Dersler II.SINIF Olasılık-İstatistik Yönetim Bilişim Sistemleri-Management information Systems

13. HİPOTEZ TESTLERİ

Giriş

Bu bölümde istatistiksel çıkarsamanın diğer bileşeni olan hipotez testleri ele alınacaktır.

13.1. Hipotez Testleri

İstatiksel çıkarsamanın iki önemli adımı vardır bunlar tahmin ve hipotez testidir.

Önceki iki bölümde tahmin süreci ele alınmıştır. Bu bölümde ise hipotez testlerine değineceğiz. Örneklem değerleri kullanılarak hesaplanan istatistiğin değeriyle bu istatistiğin temsil ettiği anakütle parametre değerinin arasındaki farklılık olup olmadığı eğer farklılık varsa bunun istatistiksel olarak önemli olup olmadığı hipotez testi ile sınanır.

İstatistiksel hipotez testi, bir araştırmada ilgilenilen bir ya da daha fazla parametre değeri hakkında ileri sürülen iddianın geçerliliğini bu parametreyi temsil edilen istatistik ve bu istatistiğin örnekleme dağılımıyla ilgili bilgilerden yararlanarak araştıran önermedir.

Hipotez testi örneklemden yola çıkılarak anakütle parametresi hakkında ortaya atılan bir iddianın geçerliliğinin sınanmasıdır.

Örneğin;

-İstatistik dersi final notlarının ortalaması 50’nin altındadır.

-A marka ampüllerin ortalama dayanıklılığı B marka ampüllerin ortalama dayanıklılığından daha fazladır

Hipotez testinde hipotezin kabul edilip edilmemesi için birden fazla hipoteze ihtiyaç duyulur.

13.2. Hipotezlerin İfade Edilmesi

İstatistiksel hipotezlerin testinde, iki hipotez söz konusudur. Bunlar, “sıfır hipotezi” ve “alternatif hipotez” şeklinde isimlendirilir. Sıfır hipotezi H0 simgesiyle gösterilir. Sıfır hipotezinde test süreci tamamlanana dek örneklem istatistiğinin değeriyle anakütle parametresi arasındaki farkın önemli olmadığı, istatistiksel olarak sıfır olduğu vurgulanır.

Sıfır hipotezinin test edilebilmesi için, bu hipotezden farklı bir hipotezin de dikkate alınması gerekir. Alternatif, H1, karşıt hipotez, H0 hipotezinin belirli bir olasılıkla reddedilmesi durumunda kabul edilir ve genellikle de araştırma hipotezinin incelendiği hipotezdir. Alternatif hipotez üç farklı biçimde ifade edilir.

 anakütle parametresi

 örneklem istatistiğini göstermek üzere:

Alternatif hipotezin yönü karar verme süreci için oldukça önemlidir.

Yukarıdaki ilk alternatif hipotez verilecek kararın anakütle parametre değerinden hem küçük hem de büyük yöndeki anlamlı farklılıklarına karşılık gelir.

İkinci alternatif hipotez anakütle parametre değerinde küçük yönde anlamlı farklılığa karşılık gelir.

Üçüncü alternatif hipotezse anakütle parametre değerinden büyük yönde anlamlı farklılığa karşılık gelir.

Daha önce de söylendiği gibi alternatif hipotezin yönü karar verme sürecinde önemlidir, sıfır hipotezinin reddedileceği bölgenin yönünü belirler.

Hipotez Çiftleri

Çift yönlü hipotez

Tek yönlü hipotez

(Sağ taraf testi)

Tek taraflı hipotez

(Sol taraf testi)

Hipotezin çift yönlü olması halinde anlamlılık düzeyi iki eşit parçaya ayrılır sağ ve sol tarafta. Hipotezin tek taraflı olması halinde ise red alanları sağ veya sol tarafta yer almaktadır.

Hipotez test sürecinde en önemli adım test istatistiğinin belirlenmesidir. Eğer hesaplanan test istatistiğinin değeri belirlenen anlamlılık düzeyi/red alanı içerisinde ise sıfır hipotezi reddedilir. Eğer hesaplanan test istatistiği red alanı içinde değilse sıfır hipotezi kabul edilir.

Hipotez testinin adımları şu şekilde sıralanabilir:

1. H0ı belirle.

2. H’i belirle.

3. Test istatistiğini seç

4. Test istatistiğini hesapla.

5. Karar ver

13.3. I. Tür ve II. Tür Hata

Aynı anakütleden çekilen örneklemler aynı hacimli olsalar dahi örnek istatistikleri farklı değerler alabilir. Anakütle parametresi hakkında kurulan hipotezler test edilirken örneklem istatistiğinin kullanılması halinde iki tür hata söz konusudur.

Sıfır hipotezi gerçekte doğruyken yanlışlıkla hipotezin reddedilmesi durumunda I. Tip hata ile karşılaşılır.Eğer sıfır hipotezi gerçekte yanlış iken, kabul edilmişse işlenen hata II. Tip hatadır.

Hipotez testinde amaç sıfır hipotezini ya kabul ya da reddetmektir. Alternatif hipotezin kabul edilmesi veya reddedilmesi sonucunda ortaya çıkan karardır. Bu açıdan aynı hipotez testinde I. Tip ya da ikinci tip hatadan yalnızca biri söz konusudur, iki tür hatayı işlemek mümkün değildir.

Çalışmalarda hem I.tür hem de II. Tür hata riskinin küçük olması tercih edilir. ( örneklem büyüklüğü) arasında bir ilişki vardır. I. Tür hata arttıkça ikinci tür hata olasılığı azalır ve örneklem büyüklüğü arttıkça I. Ve II. Tür hatalar küçülür.

Anlamlılık Düzeyi

I tip hata yapma düzeyine anlamlılık düzeyi denilir. Hipotez test edilirken anlamlılık düzeyi öne çıkar. Uygulamalarda genellikle anlamlılık düzeyi olarak seçilir. Yani kabul edilmesi gereken sıfır hipotezinin reddilmesi olasılıkları sırasıyla %1 ve %5, testin güven düzeyi ise yine sırasıyla % 99 ve % 95’tir.Anlamlılık düzeyinin belirlenmesi ile reddedilecek alanın büyüklüğü de belirlenmiş olur.

Hipotez testinde test istatistiği belirlenirken örneklem büyüklüğü, test edilecek ana kütle parametresi, varyans değerinin bilinip bilinmemesi belirleyici olur.

-Ortalama ya da iki anakütle ortalama farkları için,

 biliniyorsa Z istatistiği

 bilinmiyorsa n< 30 ise t istatistiği

 bilinmiyorsa n>30 ise Z istatistiği

-Oranlar ya da oranların farkları için Z istatistiği

13.4. Anakütle Ortalamasına İlişkin Hipotez Testleri

Ortalamasının belli bir değere eşit olduğu iddia edilen bir anakütleden seçilen n hacimli bir örneklemin aritmetik ortalamasının  ve sapmasının s olduğunu varsayalım.  ve  arasındaki fark istatistiksel olarak önemli midir? Yoksa örnekleme hatası mıdır?

  biliniyorsa Z istatistiği

  bilinmiyorsa n>30 ise Z istatistiği

  bilinmiyorsa n< 30 ise t istatistiği

Örnek:

Bir fabrikada üretilen margarin paketlerinin ortalama ağırlığı 100 gramdır, ve standart sapması 2 olan normal dağılım göstermektedir. Ratgele olarak seçilen 9 paketin ortalama ağırlığı 102 gram olarak ölçülmüştür. Paketlerin ağrılığının 100 gramdan farklı olduğu söylenebilir mi?( =0.05)

-Öncelikle hipotezler kurulur

Hipotez çift taraflı olduğunda standart normal eğrinin hem sağ hem de sol tarafı kritik alan olarak taranır. Anlamlılık düzeyi %5 olarak verilmişti bu durumda sağ ve sol tarafta %2.5 ‘lik alan kritik/red alanı olarak belirlenecektir. Standart normal eğri tablosuna bakılarak, bu alana karşılık gelen değerler bulunur.

Toplam alan 1’dir. Sağ ve sol tarafta kalan alanların 0.5 olarak düşünülür. Tablo değeri incelenirken 0.5 -0.025=0.475 değerine karşılık gelen değer alınır. Bu değer 1.96’dır.

Hesaplanan Z değeri kritik değerden büyüktür. Zhes > Ztablo (3>1.96) olduğundan H0 hipotezi reddedilir. Paketlerin ağırlıklarının 100 gramdan farklı olduğu söylenebilir.

Örnek: A marka zeytinyağı tenekelerinin ağırlığının 3680 gr’dan fazla olduğu iddia edilmektedir. Teneke ağırlıkları 150 gr sapma ile normal dağılıma uymaktadır. Rastgele seçilen 25 tenekenin ortalama ağırlığı 3725 gram olarak hesaplanmıştır. İddiayı =0.05 önem düzeyinde test ediniz.


Alternatif hipotezin tek taraflı olmasından dolayı tabloda kritik değere bakılırken,

0.5-0.05=0.45 olacaktır.

Standart Z tablosunda bulunan kritik değer 1.645’tir. Hesaplanan Z değeri 1.5 bu değerin solunda yani kabul alanı içindedir. H0 hipotezi kabul edilir yani zeytinyağı tenekelerinin ağırlığı 3680 gramdan fazladır iddiasını kabul için yeterli örnek yoktur.

Örnek: Matematik bölümü öğrencilerinin İstatistik dersinden aldıkları notların ortalamasının 70 olduğu iddia edilmektedir. Bu amaçla seçilen 49 öğrencinin aldıkları notların ortalaması 64 ve standart sapması 14 olarak bulunmuştur. İddiayı  için test ediniz.

Çift taraflı bir hipotez testi, bu yüzden sağ ve sol tarafta iki alan kritik olarak belirlenir.

Anlamlılık düzeyi 0.01 olduğundan, 0.5-0.01/2=0.495 olarak bulunur, tabloda karşılk gellen değer 2.58’dir.

Hesaplanan değer sol tarafta red alanının içindedir. -3< -2.58. H0 hipotezi reddedilir.

Örnek:

Bir marketteki margarin paketlerinin ağırlığı üzerinde brut 250 gr. yazmaktadır. Rastgele olarak seçin 14 paketin ortalama ağırlığı 235 gr ve standart sapması 14 gr olarak bulunmuştur. Paketlerin ağırlığının 250 gr ‘dan farklı olduğu söylenebilir mi? (0.05 önem düzeyi)

Örnek sayısının 14 olması ve kitle varyansının bilinmemesinden ötürü t istatistiği hesaplanmalıdır.

(n-1), 13 serbestlik dereceli t tablo değeri -2.16’dir. -4 kritik alanda olduğu için iddia reddilir paketlerin ağırlığı 250 gramdan farklıdır.

5.5. Oranlar İçin Hipotez Testi

Çift taraflı test

Tek taraflı testler

Test istatistiği

Örnek: Bir dershane öğrencilerinin yabancı dil sınavındaki başarı oranlarının %95 olduğunu iddia etmektedir. Rastgele seçilen 200 öğrenciden 180 ‘i sınavdan başarılı olmuştur. İddiayı 0.05 anlam düzeyinde değerlendiriniz.

Bulunan test istatistiği tablo değerine oldukça yakındır kabul alanı içerisinde görünmektedir. Eğer anlam düzeyi 0.01 olsaydı bu durumda hipotez yine kabul alanı içerisinde olacaktı.

Örnek:

A partisinin seçimlerde alacağı oy oranının %90’as olacağı iddia edilmektedir. Rastgele seçilen 200 kişiye hangi partiye oy verecekleri sorulmuş, bu kişilerden 180’nın A partisine oy vereceği bilgisi elde edilmiştir. Buna göre iddiayı %1 anlamlılık düzeyinde test ediniz.

Tablo değeri -2.33’tür ve hesaplanan değer -4.76 ‘dır. H0 hipotezi reddedilir.

ÖRNEK

Bir fabrikada zeytinler 500 gr.’lık paketler haline getirilmektedir. Paketleme işleminin kontrolü için 100 paket rastgele seçilmiş ve bu paketlerin ortalama ağırlığı 495gr. standart sapması da 20 gr. olarak hesaplanmıştır. % 5 anlamlılık düzeyinde paketlerin ağırlığının 500 gr. farklı olduğu söylenebilir mi?

Örnek

Bir şirkette çalışanlara verilen günlü sigara molasının 20 dakika olduğu bilinmektedir. Rastgele seçilen 5 kişinin sigara molaları izlenmiştir. Bu değerler; 15-25-10-12-30 şeklindedir. Buna göre çalışanların kullandığı sigara molası 20 dakikadır iddiasını %5 anlamlılık düzeyinde değerlendiriniz.

İddia kabul edilir, -0.412 değeri kabul bölgesi içerisindedir.

Bölüm Özeti

Bu bölümde anakütle parametresinin(ortalama,oran) belli bir değere eşit olup olmadığını sınamak amacıyla başvurulan hipotez testleri incelendi. Sıfır ve alternatif hipotezlerin nasıl oluşturulduğu, ret ve kabul alanlarının nasıl belirlendiği, test istatistiğinin nasıl düzenlendiği çeşitli örnekler üzerinde anlatıldı.

Comments