İstatistik Matematik Olasılık

İSTATİSTİĞE GİRİŞ, TEMEL KONULAR VE KAVRAMLAR, İSTATİSTİĞİN TARİHTEN GÜNÜMÜZE GELİŞİMİ

  1. İSTATİSTİĞE GİRİŞ, TEMEL KONULAR VE KAVRAMLAR, İSTATİSTİĞİN TARİHTEN GÜNÜMÜZE GELİŞİMİ

1.1. İstatistik Nedir?

Tanım 1: İstatistik, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven düzeylerini açıklama, örneklemlerden elde edilen (hesaplanan) sonuçları kitle için genelleme (çıkarsama), karakteristikler arasındaki ilişkileri araştırma, çeşitli konularda geleceğe ilişkin projeksiyon yapma, deney tasarlama ve düzenleme v.b. kapsayan bir yöntemler topluluğudur.[1]

Tanım 2: İstatistik verileri işler ve özetler, araştırmacılara yol gösterir. Değişkenler arasındaki ilişkileri incelememize, tahminler ve öngörüler yapmamıza, doğru karar vermemize yarar.[2]

Tanım 3: Belirli amaç ya da amaçlar doğrultusunda gözlenen yığın olaylardan sayısal verilerin işlenerek, ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik ve yöntemler bilimi olarak tanımlanabilir.[3]

Tanım 4: İstatistik; gözlem ve ölçme sonucunda elde edilen sayısal (rakamsal) verilerin tablolar veya grafikler halinde sunulması ve bunların karar alma sürecinde nasıl kullanılacağına ilişkin yöntemler sunar. İstatistiğe konu olacak olaylar gözlemlenebilir ve ölçülebilir olmalıdır. İstatistikler belirli ölçümler yapılarak elde edilmişlerdir yani istatistikler rastgele bulunmuş sayılar değildirler. Belirli bir kitleyi oluşturan birimlerin gözlemlenmesiyle elde edilen, ölçülebilen veya sayılabilen nicel bilgileri ifade etmektedirler. Bu nedenle; logaritma cetveli, telefon rehberi, milli piyango sonuçları birer istatistik değildirler.

Tanım 5: İstatistik; olasılığa dayalı yani sonucun baştan kesin olarak bilinmediği rastlantısal (tesadüfî) durumlar üzerinde çalışırken, belirsizlik altında karar vermeyi sağlar.

Tanım 6: Verilerin derlenmesi, işlenmesi ve yorumlanmasına yönelik yöntemlerin tümü. (İşleme ve yorum verileri temsil edebileceği düşünülen kuramsal dağılım ve modellere geçişi de içermek üzere matematiksel istatistik kapsamına girer)[4]. İstatistiksel araştırmalara birkaç örnek verecek olursak, örneğin, bir araştırmacı, hamile iken diyetisyen kontrolünde iyi ve kaliteli beslenmenin doğacak bebeğin genel sağlık ölçümlerinde, düzensiz ve bilinçsiz beslenen bir annenin bebeğine kıyasla olumlu bir etkisi var mıdır? Fazla kilolu olmanın yaşam süresi üzerinde gerçekten olumsuz etkileri var mıdır? Sigara kanser ilişkisinin boyutu nelerdir? Kanser olmayı tetikleyen diğer faktörler neler olabilir ve risk sıralaması nasıldır?

1.2. İstatistiğin Temel Konuları

İstatistik konuları bakımından ikiye ayrılır; Betimsel (tasviri) istatistik ve Çıkarımsal istatistik.

1.2.1. Betimsel İstatistik

Verilerin toplanması, yorumlanıp özetlenmesi gibi konularla ilgilenir. Tanımsal istatistik, verilerin bir takım sayısal ve(ya) grafiksel yöntemlerin kullanımı ile bilgiye dönüştürülmesini ve karar verme sürecinde kullanılmasını sağlar.[5]

İstatistik, geçmişi ve içinde bulunulan durumu tanımlayarak bir veri kümesine ilişkin özet değerler ve grafikler ortaya koyduğunda betimsel istatistik (descriptive statistics) adını alır. Özetleme ve verilerin yoğunlaştırılması diğer bir deyişle verilerin hacimleri azaltılarak kullanım değerlerinin arttırılması betimsel istatistiğin konusuna girer. Tablolar ve grafikler yardımı ile verilerin özetlenmesi ve çok sayıda sayıdan oluşan bir veri grubunun “ortalama” gibi tek bir sayıya indirgenmesi yine bu alan için geçerlidir. Kısaca betimsel istatistik bir veri kümesinde bulunan bilgiyi sayısal ve grafiksel yöntemleri kullanarak özetler ve sunar.[6]

Betimsel amaçlı istatistik kitledeki tüm birimlerden ilgili değişken ya da değişkenler için veri toplandığında bunları kullanarak kitleyi özetlemeyi (betimlemeyi) amaçlar. Bu ise frekans dağılımı oluşturularak, grafikler çizilerek ya da parametreler (kitle ortalaması ve varyansı) hesaplanarak yapılır.[7]

1.2.2. Çıkarımsal İstatistik

Tümevarımsal amaçlı istatistik kitle(ler)den rastgele seçilen örneklem(ler)den toplanan verileri kullanarak kitle(ler) nin parametrelerini tahmin etmeyi veya parametrelerle ilgili olan savların doğru olup olmadığının araştırılmasını amaçlar. Yanlı örneklem gözlendiğinde belirsizlikler içeren kitle hakkındaki önermelere geçmek için geliştitilen süreçle istatistiksel sonuç çıkarır.[8]

Çıkarımsal istatistik, araştırma sürecinin betimsel istatistiğin bıraktığı yerden devam ettirilmesi suretiyle, çalışmanın amacına uygun bir şekilde daha ileri tekniklerle (olasılık başta olmak üzere) karar verme ve kitleye dair çıkarsamalar yapma sürecidir. Bu çıkarsamalar örnekleme dayalı olarak yapıldıkları için belirli bir hata düzeyinde ifade edilirler. (Kitle N adet birimden oluşan teorik topluluktur, aslında tüm birimlere ulaşmak olasıdır ancak zaman ve maliyet kısıdından dolayı genellikle istatistiksel çalışmalar kitleyi iyi bir biçimde temsil eden daha küçük alt gruplar yani örneklemler üzerinden yürütülür.

Örneklemin büyüklüğü n ile gösterilir. O halde N büyüklüğündeki bir kitleden n büyüklüğünde tane mümkün örneklem çekilebilir( ). Bu örneklemler büyüklük yani hacim olarak birbirinin aynı fakat içerdikleri birimler bakımından birbirinden farklıdırlar, kombinasyonun doğası gereği seçilen birim yerine konmamaktadır, bu nedenle mümkün örneklem sayısı hesaplanırken permütasyon yerine kombinasyon kullanılmaktadır.

Örnekleme dayanan çıkarımlar mutlak doğru olamayacağından “olasılık” kelimesi kullanılarak ifade edilir. Çıkarımsal istatistiğin genel olarak kullandığı yöntem “tümevarım” dır. Önceleri betimsel amaçlar taşıyan istatistik, 17-18 ve 19. yy lar boyunca Bernoulli, Gauss, Laplace, Moivre gibi ünlü matematikçilerin olasılık teorisini geliştirmeleriyle çıkarımsal istatistiğin temellerini atmışlardır.[9]

***Her şey sabit, belirli ve kontrol altında olsaydı, yani değişkenlik olmasaydı istatistiğe gerek kalmazdı!!!

Yukarıdaki cümle istatistiğin özünü ifade etmektedir. Her şey bir ihtiyacı gidermek için ortaya çıkıp kabul gördüğüne göre, istatistik de, gerçek hayatı olduğu gibi ele alabilmeyi sağlamıştır. Olasılık teorisinin katkılarıyla belirsizliği ölçebilmeyi, geleceğe dair tahminler ve çıkarımlar yapabilmeyi olanaklı kılmıştır. Yaşamın belirsizlikleri insanoğlunu her zaman 2 kere 2’nin dört etmeyeceği gerçeğiyle karşı karşıya bırakmıştır. Özellikle sosyal bilimlerde olayları salt pozitif bilimlerle açıklamak yetersiz kalmaktadır. İstatistik böyle durumlarda ölçümlemeyi sağlayabilen yöntem ve teknikler bütünü olarak öne çıkmaktadır.

1.3. İstatistiğin Tarihçesi

“İstatistik kelimesi Almanya’da Achenwall tarafından 1748’de kullanılmaya başlanmışsa da, istatistik çalışmaları çok eski çağlara kadar uzanır. Tacitus, imparatorluk zenginlikleri üzerinde Augustus’un geniş bir anket yaptığını yazar. Böylece askerler, gemiler her çeşit gelir kaynakları sayılmış ve kamu gelirleri tespit edilmiştir.

Bütün Ortaçağ boyunca ve 17. Yy’a kadar istatistik sadece tasviri olarak kalmıştır. Bu alanda iki okul ortaya çıktı: Göttingen Üniversitesi profesörü ve Almanlar tarafından istatistiğin babası olarak bilinen Achenwall’in temsil ettiği tasviri okul ve bazı sosyal olayların yaklaşık düzenliliğinden öngörüler ve kanunlar çıkarmayı deneyen siyasi matematikçiler okulu. 18. Yy’da Fransız Desparcieux ve İsviçreli Wargentin toplum olaylarını öngörmenin pratik önemini göseren ve çok gelişmekte olan sigorta sanayinin hareket noktasını teşkil eden ilk ölüm tablolarını (mortalite tablosu) düzenlemişlerdi.

Fransa’da ilk resmi istatistik bürosu 17. Yy’ın sonlarında kurulmuş ve içişleri bakanı Chaptal 1801’de genel nüfus sayımını gerçekleştirmişti. Türkiye’de ilk resmi istatistik bürosu 1933’te kuruldu.

Jacques Bernoulli ve özellikle Laplace, tasviri sayısal bilgilere matematik bilgileri ilave ederek sonuçların değerlendirilmesinde olasılık hesap imkânlarının kullanılmasını araştırdılar. Birincisi ünlü “büyük sayılar kanunu” nu ortaya attı, ikincisi ise “analitik olasılık teorisi” adlı eserinde karmaşık sebepli doğal olayların incelenmesinde olasılık hesaplarından sağlanacak faydaları açıkça belirtti. Quotelet, çevresinde bütün diğer insanların yer alacağı hayali bir “ortalama insan” bulmak maksadıyla bu yöntemin uygulanışını insanların fiziki, ahlaki ve düşünsel özelliklerine uyguladı.” [10]

“Quotelet bütün sosyal olayları birey etrafında toplamıştır. Daha ileri giderek istatistiği bütün sosyal alanlara hatta ahlaki olaylara da yaymıştır. İlk “sosyal kriminolog” olarak adlandırılmaktadır. 1836 yılında Quotelet, “Toplum suçu hazırlar, Suçlu ise ancak bir araçtır” demiştir. Bugün Quotelet modern istatistiğin kurucusu olarak kabul edilmekle birlikte, ileri sürdüğü sistem ve vardığı sonuçlar reddedilmektedir. Quotelet ’ten sonraki gelişmeler istatistik yöntembiliminde matematiğin daha yaygın bir şekilde uygulanmasını sağlamış ve matematiksel istatistik disiplininin meydana çıkmasına yol açmıştır.

İstatistik; Türklere de yabancı bir bilim dalı değildir. Selçuklular döneminde İran’da, İlhanlılar döneminde Hint’te nüfus sayımları düzenlenmişti. Öte yandan Osmanlı İmparatorluğu’nun yönetim sistemi nüfus ve arazi hakkında düzenli biçimde bilgi toplamasını gerektiriyordu. Bu nedenle imparatorluk zamanında 30-40 yıl gibi aralıklarla nüfus sayımları ve arazi yazımları yapılmaktaydı. Bu istatistiksel işlemler sırf vergi toplanması amacıyla yapıldığı için sadece vergi mükellefleri göz önünde bulunduruluyordu. İmparatorluğun gerileme devrinde bu sayımların arkası kesilmiş, modern tekniklere dayanan istatistikler de 20. Yy’e kadar ülkeye girememiştir. Gerçi bu gibi istatistiklerin düzenlenmesi yolunda 19. Yy’de bazı çalışmalar yapılmıştır. Örneğin orduyu modernleştirmek amacıyla askere alınabilecek erkeklerin sayısı öğrenilmek istenmiş ve böylece ilk sayım 1831’de gerçekleştirilmiştir. Ancak bu sayım yalnız erkekleri dikkate aldığı gibi ülkenin bütünü de kapsamamıştır. Nitekim sayım yapılan yerler Rumeli ve Anadolu sancakları ve kasabalarıdır. Dolayısıyla bu sayım bugünkü anlamıyla gerçek bir nüfus sayımı olmaktan uzak kalmıştır. 1844’te yapılan ikinci nüfus sayımının amacı ise kimlik belgesi verilecek vatandaşların belirlenmesi idi. Bu nedenle kadınlar da erkeklerle birlikte sayılmıştır. Ne var ki askerlik korkusuyla birçok erkek sayım dışında kalmıştır.

  1. Yy’de ülke nüfusu hakkında bilgi verecek sonucu sayım 1874’te başlamış ve araya giren Rus savaşı nedeniyle 1884’e kadar sürmüştür. Nüfus kütüklerini düzenleme ve halka nüfus tezkeresi verme amaçlarıyla başlatılan bu sayımın uygulanmasında da bazı aksaklıklar görülmüştür. Birçok teknik hata içeren ve kısmi nitelikteki bu sayımlar yanında ölüm ve doğumlar gibi nüfus hareketlerini suçları ithalat ve ihracatı belirlemek amacıyla çalışmalar yapılmıştır. Ne var ki bu çabalar da sonuçsuz kalmıştır.” [11]

1.3.1. Tarihten Günümüze Öne Çıkan İstatistiksel Çalışmalar

  • Antikçağ’da Çin’de, Mısır’da, Yunanistan’da nüfus ve bu nüfusun maddi yaşam koşullarına ilişkin sayısal verilere sahip olma gereksinimi izlerine rastlanmıştır.
  • Roma’da düzenli nüfus sayımlarına rastlanır. Roma’da önce 5 yıl, sonra da 10 yıl ve 15 yıl gibi düzenli aralıklarla yapılan ve “census” adı verilen bu sayımlar 600 yıl kadar sürmüştür. Her Romalı kendi ve babasının adını, servetini, arazisini, kölelerinin sayısını bildirmek zorundaydı.[12]
  • 1662’de Graunt erkek çocuklarının doğumlarının kız çocuklarının doğumlarına oranı gibi değişmezlikleri ortaya çıkardı.
  • 1742’de Edmond Halley çağdaş aktüer (hayat sigortacılığı) çalışmalarının temelini oluşturan bir hayat tablosu yaptı.
  • 1767’de Süssmilch erkek doğum oranı ve 20 yaşına dek erkek çocuk oranındaki gelişme üzerine önemli çalışmalar yayınladı.
  • Pierre Simon De Laplace (1749-1827) “Çözümsel Olasılık Kuramı” (1812) adlı eserinde, nedenlerinin tümünü bilip tek tek çözümlenemeyecek kadar karmaşık olan doğal olayların incelenmesinde bu kuramdan sağlanacak yararları ortaya koydu. Önceleri betimsel amaçlar taşıyan istatistik, 17-18 ve 19. yy boyunca Bernoulli, Gauss, Laplace, Moivre gibi ünlü matematikçilerin olasılık teorisini geliştirmeleriyle çıkarımsal istatistiğin temellerini atmışlardır.[13]
  • Adolphe Quotelet (1796-1874) yöntemin uygulama alanını, canlı varlıkların antropometrik, psikolojik ve toplumsal açıdan incelenmelerini sağlamıştır. Onun girişimiyle 1885’te Londra’da kurulan Uluslararası İstatistik Enstitüsü’nün öncüsü olan ilk uluslararası istatistik kongresi 1853’te Brüksel’de toplanmıştır.
  • Karl Pearson (1857-1936) Biyoistatistik’i buldu. Bu yıllarda istatistik ile iktisadın arasındaki ilişkilerin fark edilmesiyle ekonometri doğmuş oldu. [14]

1.4. Türkiye İstatistik Kurumu Hakkında Genel Bilgiler

“Cumhuriyet döneminde istatistik işlerine büyük ölçüde önem verilmeye başlanmıştır. Nitekim 1926’da Merkezi İstatistik Dairesi kurulmuştur. Kurumun adı adeta yazboz tahtası yapılarak 1930’da İstatistik Umum Müdürlüğü, 1945’te İstatistik Genel Müdürlüğü, 1952’de İstatistik Umum Müdürlüğü, 1960’ta İstatistik Genel müdürlüğü şekline çevrilmiş ve 1962’de Devlet İstatistik Enstitüsü adında karar kılınmıştır. 2005 yılında ise Türkiye İstatistik Kurumu (TUİK) kurulmuş olup, kurum istatistik konseyi ve Türkiye İstatistik Kurumu başkanlıklarından oluşmuştur. TUİK Başkanlığı 5429 sayılı Türkiye İstatistik Kanunu’nun uygulanması sağlamak ve kanunla kendisine verilen görevleri yerine getirmek üzere kurulmuş olup, merkez ve taşra örgütlerine sahiptir. Merkez örgütü ana hizmet danışma ve yardımcı hizmet birimlerinden oluşmaktadır. Taşra örgütü ise bölgesel düzeydeki tüm istatistiksel faaliyetleri yürütmek ve yerel birimlerle koordinasyonu sağlamakla görevli bölge müdürlüklerini kapsamaktadır.”[15]

“Enstitü gerekirse Ankara dışında geçici veya sürekli bürolar kurma ve mahalli muhabirler kullanma yetkisine sahiptir. Görevleri: her çeşit çalışmalara ilişkin istatistikleri düzenler, istatistikle ilgili olarak kamu kuruluşları arasında koordinasyon saplar, çözüm ve incelemeler yapar, düzenlenen istatistikleri yayınlar, istatistik yıllığı çıkarır, sayımlar ve anketler hazırlar ve sonuçlarını yayınlar, kamuoyu çalışmaları yapan bilimsel kurumların çalışmalarında yardım eder, yurt içi ve yurt dışı istatistik eğitim işleri yapar.”[16]

Kurumun adı 2005 yılında Türkiye İstatistik Kurumu (TUİK) olarak değiştirilmiştir ve halen bu isimle anılmaktadır.

1.5. Günümüzde İstatistik

ASA (American Statistical Association) 2013 yılını dünya İstatistik yılı ilan etmiştir. North Carolina Üniversitesi’nden Marie Davidian’ın 19 Aralık 2013’te JASA (Journal of American Statistical Association) dergisinde yayınlanan “The International Year of Statistics: A Celebration and A Call to Action” adlı makalesinde istatistiğin dünyada yükselen bir değer olmasından bahsetmektedir.

Son yıllarda gazetelerde istatistikle ilgili başlıklar atılmıştır, birkaç örnek vermek gerekirse;

-“For today’s graduate, just one word: Statistics”,  The New York Times, 2009.

-“The allure of the statistics field grows”,  The Boston Globe, 2012

-“What are the odds that stats would be this popular?”, The New York Times, 2012.

-“The numbers guy”,  The Wall Street Journal, 2013.

Öne çıkan yazılar bunlar olmakla beraber, istatistik biliminin yükselişi çok sayıda makaleye konu olmuştur.

İstatistiğin doğru kullanımı ve gücü hakkında son yıllarda en büyük katkıyı 2012 Amerika devlet başkanlığı seçimlerinden önce yaptığı tutarlı tahminlerle Nate Silver yapmıştır. “The Signal and the Noise: Why So Many Predictions Fail But Some Don’t?” adlı kitabı bir anda en çok satanlar arasına girerek, tüm siyasilerin ve halkın ilgi odağı haline gelmiştir.

Ülkemizde çok uzak değil, bundan 10-15 yıl önce istatistik denilince akla, futboldaki özet sonuçlar veya sokakta yapılan anketler gelmekteydi. Oysa günümüzde tıpkı dünyada olduğu gibi istatistik hayatın her alanına girmiş ve etkin bir biçimde kullanılmaya başlanmıştır.

 

Comments