AUZEF Dersler II.SINIF Olasılık-İstatistik Yönetim Bilişim Sistemleri-Management information Systems

7. MERKEZİ DEĞİŞİM ÖLÇÜLERİ

7. 1. Merkezi Değişim Ölçüleri

Bir serideki gözlemlerin (birimlerin) birbirinden ya da herhangi bir ortalama değerden uzaklıklarının çeşitli ölçümlerine merkezi değişim ölçüleri denir. Bir seriyi özetlemede ortalamalr tek başına yeterli bir veri değildirler. Ortalamaların yanısıra değişim ölçülerine de ihtiyaç vardır. Örneğin aşağıda ortalamaları birbiriyle aynı ama dağılımları farklı üç seri göreceksiniz:

Şekil.7.1. Seri 1

Seri1: 5 5 5 6 7 7 8 8 8 8 9 9 11 12 12

Şekil.7. 2. Seri 2

Seri2: 6 6 7 8 9 9 9 10

Şekil.7. 3. Seri 3

Seri3: 5 8 11

Her üçünün de ortalaması birbiriyle aynı olmasına rağmen, veri sayıları, değişimleri, dağılımları birbirinden farklıdır. Öyleyse artık değişim ölçülerinin neler olduklarına ve nasıl hesaplandıklarına ilişkin açıklamalarımıza geçebiliriz.

Verilerin dağılımını ölçmede, gözlem değerlerinin ortalamadan sapmalarını kullanabiliriz. Bu sapmalar yani  ne kadar büyükse, Xi gözlemi ortalamadan o denli uzakta demektir.

Şekil.7. 4. Birimlerin Ortalamadan Uzaklıkları (sapmaları)

7.1.1. Varyans

Şekil. 7.4’e bakalım. Sizce bu sapmalar ne anlama geliyor ve nasıl ölçülecek?

Mesela,  ‘dan sapmalar ile ölçülebilir mi? Hayır ölçülemez, çünkü ortalamadan sapmaların toplamı daima sıfırdır.

Öyleyse biz de sapmaların karelerini alıp işe başlarız yani aritmetik ortalama değil de, kareli ortalamayı kullanırız. Sapmaların kareli ortalaması bulunduğunda, istatistik teorisinde ve uygulamalarda en yaygın kullanılan dağılma ölçüsü olan standart sapmayı yani σ’yı elde ederiz. Standart sapmanın karesine yani σ2’ye ise varyans denir. Varyans değişimin ölçüsüdür.

Varyans kısa yoldan şöyle hesaplanabilir:

7.1.2. Standart Sapma

Standart sapma, varyansın kareköküdür.

Standart sapmanın normal yoldan bulunuşu aşağıdaki gibidir:

σ2 kitle varyansıdır, s2 ise örneklem varyansıdır.

7.1.2.1. Sıklık Serisinde Standart Sapma Hesabı

Kitlede:

Örneklemde:

7.1.2.2. Sınıflanmış Seride Standart Sapma Hesabı

Kitlede:

Örneklemde:

Sheppard düzeltmesi:

Sınıfları temsilen sınıf ortalarının gelişigüzel tam orta nokta olarak kabul edilmesi (aslında belki verilerin sınıftaki dağılımı tam ortalarda olmayabileceği halde), standart sapma hesabında hataya neden olur. Bunu Sheppard düzeltmesiyle gidermek mümkündür.

σ* düzeltilmiş standart sapmadır. c, ortak sınıf genişliğidir. Standart sapma bulunduktan sonra bu düzeltme yapılırsa, sınıf ortalarını tam orta nokta kabul etmekten kaynaklanan hatanın giderilmiş olduğu düşülmektedir.

Varyansın hesaplanmasıyla ilgili birkaç örnek yapalım:

Örnek: Aşağıdaki basit seride varyans ve standart sapmayı hesaplayınız.

Bu veri kümesini kitle gibi düşünürsek kullanmamız gereken formül şudur:

Öncelikle kitle ortalamasını yani µ’yü hesaplayalım. Basitçe tüm gözlemleri toplayarak gözlem sayısına bölüyoruz.

µ =

sonra formüle bakıyoruz, dediğimiz gibi formüller konuşurlar ve bize sırasıyla ne yapmamız gerektiğini söylerler. Şimdi kitle ortalaması µ’yü 12 olarak hesapladık. Jher bir gözlem değerini tel tek bu ortalama değerden saptıracağız. Bunun için bir kolon oluşturalım:

Sonra bu değerlerin tek tek karelerini alıp toplayacağız ve bulduğumuz toplamı n’e yani 6 ‘ya bölerek varyansı bulmuş olacağız.

σ2 = 

Standart sapma ise varyansın karekökü olduğuna göre;

σ = 6.758’dir.

Bu veri kümesini örneklem gibi düşünürsek kullanmamız gereken formül şudur:

s2 = 274/ 5 = 54.8

s = 7.403 olarak elde edilir.

Uyarı!!! örneklem varyansında paydada (n-1) kullandığımız için, kitle varyansına göre bir miktar daha büyük bir değer buluyoruz. Böyle yapmamızın nedeni, örneklem üzerinden çalışıldığında bir miktar hataya göz yummak demektir. Halbuki kitle üzerinden yapılan hesaplarda yani parametre hesaplarken tamsayım söz konusu olduğu için böyle düzeltmelere ve önlemlere gerek yoktur, zira hesaplanan değerler kesindir.

Örnek: Aşağıdaki sıklık serisinde varyansı hesaplayınız.

Bu seri aslında şu basit serinin toplulaştırılmış halidir:

Şimdi varyansı bulalım. İlk yapmamız gereken şey ortalamayı bulamaktır. İsterseniz yine bu veri kümesini bir örneklem gibi kabul edelim;

 == 7.6

Formülümüz şöyle; 

Şimdi tüm X değerlerini ortalamadan saptıracağız:

Şimdi bu farkların karelerini alalım:

Şimdi bu karesel ifadeleri sıklıklarla ağırlıklandıracağız yani çarpacağız;

Artık hepsini toplayıp (n-1)’e bölebiliriz ve böylece örneklem varyansını bulmuş oluruz:

s2 = = 5.156

s= 2.27’dir.

Varyansın Formülünü İnceleyelim

Varyans kelimesi “variation” yani değişim anlamına gelmektedir. İstatistiksel olarak yorumlarsak, bir veri kümesindeki gözlemlerin ortalamadan uzaklıklarının bir ölçüsüdür diyebiliriz. Varyansı büyük bir seride birimlerin ortalamadan farklı (ortalamaya uzak) değerlere sahip olduğunu görürüz. Varyansın küçük olması ise gözlemlerin ortalama dolayında dağılım gösterdiği durumlarda meydana gelir. Bu anlatılanlardan şunu anlamalıyız, eğer bir serideki gözlem birimleri ortalamadan uzakta çok farklı değerler alıyorlarsa bu serinin varyansı (değişimi, yayılımı), ortalama dolayında bir dağılıma sahip olan bir veri kümesinin varyansına göre daha büyüktür. Formülün paydasında “n” vardır, yani birim sayısı arttıkça varyans küçülmektedir, varyansın yani değişimin küçülmesi ise ileriki konularda anlatacağımız parametre tahminlerinin daha isabetli daha az hata ile yapılmasını sağlayacak bir unsurdur.

7.1.3. Değişim Katsayısı

Bir seriyi özetlemede sadece ortalamanın yeterli olamayacağından bahsetmiştik. Değişim katsayısı, ortalama ile varyansı birlikte kullanarak serilerin değişimlerini ölçmeyi ve farklı türden olsalar bile kıyaslama imkânı sağlayan bir ölçüttür. Değişim katsayısının formülü aşağıdaki gibidir:

 veya, 

Değişim katsayısı ölçü birimlerinden bağımsızdır. Oransal yapısından dolayı, pay ve paydasında aynı cins ve büyüklükten değerler birbirini götüreceği için basit seri, sıklık serisi ve sınıflanmış seriler arasındaki cins ve büyüklük farklılığını ortadan kalkar.

DK’sı küçük olan serilerin, diğerlerine göre daha az değişken olduğu (daha homojen yani ortalamaya yakın dağılıma sahip) birimlerden oluştuğu söylenir. Çünkü standart sapma küçüldükçe DK da küçülür. Standart sapmanın küçük olması ise ancak ortalama etrafındaki saçılımın ’ya doğru çekilmesiyle mümkündür birimler ’dan uzaklaştıkça standart sapma da büyümektedir.

Örnek: İki hisse senedi olsun. Bu hisselerin 1 aylık ortalama getirileri ve standart sapmaları aşağıdaki gibi ise, siz bir portföy yöneticisi olarak riski seven bir yatırımcıya hangi hisse senedini tavsiye edersiniz?

μ1=70 σ1=6

μ2=25 σ2=3

DK sı büyük olanı yani 2. hisse senedini tercih etmelidir. Şayet riski sevmeyen yatırımcı olsaydı, ona değişimi görece daha az olan ilk hisse senedini almasını tavsiye ederdik. Borsada riskli senetlerin getirisi de kaybı da büyüktür. Ama riski seven yatırımcı “risk yoksa getiri de yoktur” mantığına sahip olduğu için bu onun tercihidir. Riski düşük olan senetler her ne kadar güvenli olsa da, maalesef getirisi de düşüktür. Elbette bu bir tercih meselesidir.

7.2. Chebyshev Teoremi

Ortalama ve standart sapmanın birlikte kullanıldığı bir durum da, verilerin yüzde kaçının hangi aralıkta bulunduğunu ölçmeye yarayan Chebyshev Teoremi’dir. Ortalaması μ, standart sapması σ olan bir veri kümesindeki gözlemlerin  aralığına düşenlerin oranı en az ’dir. Burada k, 1’den büyük bir sayıdır.

Örnek: Bir lisedeki öğrencilerin IQ ortalaması 105, standart sapması 9’dur. Öğrencilerin en az % kaçı 85,2 ile 124,8 arasında IQ’ya sahiptir?

Buradan k=2,2 elde edilir.

Yorum: Öğrencilerin en az %79’u verilen aralıkta IQ skoruna sahiptir.

Comments