4.1. İstatistikte Önemli Notasyonlar
İstatistiksel analiz yapmanın yolu bir takım hesaplamalar yapmaktan geçer. Bu hesaplamalarda kullanılan bir takım önemli notasyonların hatırlanması, ileriki haftalarda yapacağımız istatistiksel analizlere temel teşkil etmekte ve büyük önem taşımaktadır. Matematik konularından aşina olduğumuz bu notasyonlar çok basit gibi görünse de, istatistik hesapların hassas oluşu ve en küçük bir işlem hatasının bile hatalı sonuç bulmaya dolayısıyla karar alma ve yorum yapma sürecinde gerçeği yansıtmayan sonuçlarla bizi karşı karşıya bırakmaktadır.
4.1.1. Ʃ (Toplam Sembolü)
Kullanacağımız en temel notasyon “Ʃ” sembolüdür. Bu sembol, birimleri tek tek toplamak anlamına gelir. Yani toplama operatörüdür. X bir değişken olmak üzere, şayet şeklinde bir ifade görürseniz, X’in tüm gözlem değerlerini toplayacağımızı anlamalıyız.
N hacimli bir kitleden n büyüklüğünde rastsal bir örneklem çekmiş olalım. Bu örneklemin ortalamasını bulmak için yapmamız gereken işlem, tüm gözlem değerlerini toplayarak, sonucu, birim sayısına yani n’e bölmektir. Yaptığımız bu basit işlem formül olarak şeklinde ifade edilir. Burada , örneklem ortalamasıdır. Üstteki çizgi ilgili değişkenin yani üstüne konduğu değişkenin ortalaması olduğunu göstermektedir. Ortalama formülünün payında bulunan ifadesi, i=1’den n’e kadar tüm X değerlerini toplayınız. Daha sonra ortalamayı hesaplamak için bu sonucu toplam gözlem sayısına yani toplam birim sayısına yani n’e böleriz.
Örnek: Bir ailedeki çocukların boy uzunlukları aşağıdaki gibidir. Çocukların boy ortalamasını hesaplayınız.
Sedef: 142 cm, Ömer: 156 cm, Mira: 168 cm, Murat: 172 cm
Burada gözlem sayımız (birim sayımız) ailedeki çocuk sayısıdır yani n=4’tür. X’in sağ alt köşesinde yer alan “i operatörü” sıra belirtmektedir. Burada X1= 142 cm (Sedef’in boyu), X2=156 cm (Ömer’in boyu), X3=168 cm (Mira’nın boyu), X4= 172 cm (Murat’ın boyu). O halde ailedeki dört çocuğun boy ortalaması;
= = 159.5 cm olarak bulunur.
4.1.2. işleminin uygulanışı
Burada yapılması gereken işlem, X’in tüm değerlerinin karelerini alarak bunları toplamaktır. Sıklıkla yapılan bir hata şudur, X’leri toplayıp elde edilen sonucun karesini almaktır. Yani;
≠ ()2
Yapmamız gereken X’lerin tek tek karelerini almak, sonra bu kareleri toplamaktır.
Örnek: Aşağıda verilen veri kümesinde ’yi hesaplayınız.
= (52 + 142 + 872 + 1012) = 17991’dir.
Halbuki sıkça karıştırılan ()2 = (5 + 14 + 87 + 101)2 = 2072 = 42849’dur. Aradaki farka dikkat etmek gerekir.
4.1.3. Notasyonu
Bu formülde anlatılmak istenen, öncelikle veri kümesinin ortalamasını bulmak, sonra da her bir X gözlem değerinden ortalamayı çıkarmaktır, en sonunda da bu farkları toplamaktır. Yani ortalamadan saptırılan değerlerin toplamı demektir. Aslında formüller adeta konuşmaktadır, bize sırasıyla ne yapmamız gerektiğini söylemektedir. ifadesi bize, X’lerden ortalama değerlerini tek tek saptır (yani fark al), sonra da bu değerleri topla demektedir.
Örnek: Aşağıdaki veri kümesi için ‘i hesaplayınız.
İlk yapacağımızşey beş gözlemden oluşan bu veri kümesinin ortalamasını bulmaktır.
= = = 34
Sonra X’leri tek tek ortalamadan saptıracağız. Bu işlemi bir sütun açarak yukarıdan aşağıya doğru sırayla yazmak gerekir. Yan yana yazmak, ileride daha çok sayıda veriyle karşılaşınca, işlemleri içinden çıkılmaz bir hale sokar. Şimdiden bu el alışkanlığını kazanmak ileride bize kolaylık sağlayacaktır. O halde ortalamadan sapmalar serisini oluşturalım:
Uyarı!!! Bir seride ortalamadan sapmaların toplamı daima sıfırdır. Eğer sıfır bulmadıysanız işlem hatası yapmışsınız demektir.
Yukarıdaki örnekte ortalamadan sapmaların toplamı;
= (-22 -13 -1 +11 +25) = 0’dır.
4.1.4. Notasyonu
e sayısı matematikte bir sabittir ve yaklaşık değeri e=2.718’dir. Dönem sonunda kesikli dağılımlar konusuna geldiğimizde “Poission Dağılımı” ile ilgili olasılık hesaplarken e’yi sık sık kullanacağız.
e0 = 1
e-2 = 0,1353
e5 = 148,413 v.b.
4.2. Faktöriyel Hesabı
“!” ile gösterilen bu notasyon, geriye doğru tüm rakamların çarpılması anlamına gelir.
0! =1
1! =1
2! = 2.1 =2
3! = 3.2.1 =6
4! = 4.3.2.1=24
……
30! = 30.29.28……5.4.3.2.1= 2,652528598 ×1032
4.3. Yuvarlama İşlemi
Hesap makinelerinde virgülden sonra çok sayıda rakam gösterilir. Bu kadar çok sayıyla baş etmenin yolu yuvarlama yapmaktır. Virgülden sonra kaç basamak ilerletmek gerektiğini zaman içerisinde uygulamalar yapa yapa deneyimleyip karar vereceğiz, ancak tecrübelere dayanarak, virgülden sonra üç basamak yürütmenin isabetli sonuçlar verdiğini söyleyebiliriz. Elbette bu mutlak bir kural değildir.
Yuvarlama işlemi yuvarlanacak basamağın sağında kalan sayıya bağlı olarak gerçekleştirilir. Eğer bu rakam 5 ten küçükse yuvarlanacak basamak olduğu gibi bırakılır, eğer 5’ten büyük ve eşitse bir üst sayıya yuvarlanır. Birkaç örnek verelim:
Şimdi bu sayıyı virgülden sonra 3 basamak ilerletmek suretiyle kullanacağımızı düşünelim. Bu durumda virgülden sonra 3. Basamakta yer alan rakama ve sağındaki ilk rakama bakarak yuvarlama yapacağız. Virgülden sonraki 3. Basamakta yer alan sayı “6” dır, 6 ‘nın sağında ise “8” bulunmaktadır. “8” rakamı 5’ten büyük olduğuna göre 6’yı bir üst rakama yuvarlarız, yani bu sayının yuvarlanmış hali 2.427’dir.
1.58912458 yuvarlanmış hali 1.589’dur. 9’un sağındaki rakam 5’ten küçük olduğu için 9 rakamı aynen kalır.
2.45726911111178 yuvarlanmış hali 2.457’dir.
4.4. İstatistikte Frekanslar (Sıklıklar) Bakımından Seri Türleri
Üç tür seriden bahsedebiliriz; basit seri, sıklık serisi, sınıflandırılmış seri.
4.4.1. Basit Seri
Verilerin küçükten büyüğe veya büyükten küçüğe sıralandığı seri türüdür, başka hiçbir kuralı yoktur.
4.4.2. Sıklık Serisi
Gösterimi yan yana iki sütun şeklindedir. Sol baştaki sütunda X değerleri, sağdaki sütunda ise sıklıkları yani frekansları temsil eden fi kolonu bulunur.
Örnek:
Bu seri aslında 2 2 5 9 9 9 basit serisinin toplulaştırılmış ve düzenli yazımından başka bir şey değildir. Solda X’in aldığı değerler, sağdaki sıklık kolonunda ise bu değerlerden kaçar tane olduğu belirtilir.
4.4.3. Sınıflanmış Seri
Verilerin belirli kurallara göre toplulaştırılarak sınıflar halinde sunumuna sınıflanmış seri denir.
Örnek:
Bu seriye bakıldığında 5-8 sınıfında yani bir sayı doğrusu gibi düşünürsek 5 ile 8 arasında değer alan 5 adet X gözlem değerinin olduğunu görürüz. 8 ile 11 arasında 7 adet veri, 11 ile 14 arasında 2 adet veri, 14 ile 17 arasında 1 tane veri olduğunu görürüz. Genel olarak, 5 ile 17 arasında değer alan 15 adet verimiz var demektir. Burada dikkat edilmesi gereken husus, verilen aralıkta yani sınıfta kaçar tane veri olduğunu biliyoruz ama bu değerlerin tam olarak kaç olduğunu bilmiyoruz. Örneğin ilk sınıfı ele alalım ve sayı doğrusu üzerinde anlatmaya çalışalım:
Yani verilen sınıf aralığında kaç gözlem olduğunu biliyoruz ama bunların tam olarak hangi değeri aldıklarını bilmiyoruz.
Uyarı!!! Sınıflanmış seride sınıfın üst sınırını dahil değil gibi düşünelim. Örneğin ilk sınıf 5-8 sınıfında 5’ten 8’e kadar olan değerler kastedilmektedir ama 8 dahil değildir, yani [5,8) aralığıdır. Bir başka gösterim –den az gösterimidir, sınıflar şu şekilde sıralanır, 5-8 den az, 8-11’den az, v.b.
Comments