10. Sınıf · İstatistiksel Araştırma Süreci
Veri Toplama, Yorumlama ve Değerlendirme
İyi bir istatistik, sayılardan önce iyi bir süreçle başlar. Bu derste bir istatistiksel araştırmanın adımlarını — soruyu belirleme, veri toplama, bulgulara ulaşma ve değerlendirme — ve bu adımlarda dikkat edilmesi gerekenleri (örneklemin temsil ediciliği, yanlılık, sonuçların güvenilirliği) öğreneceğiz. Amaç: bir araştırmaya bakıp "bu sonuca güvenebilir miyim?" diye sorabilmek. Bol örnek ve "Sıra Sende" alıştırmalarıyla pekiştireceğiz.
1. Araştırma Sürecinin Adımları
İstatistiksel bir araştırma şu döngüyü izler:
- Soru belirleme: araştırılacak net bir soru ("Öğrenciler günde kaç saat çalışıyor?").
- Veri toplama: uygun bir örneklemden veri elde etme.
- Bulgulara ulaşma: veriyi özetleme (ortalama, tablo, grafik).
- Değerlendirme: sonucu yorumlama ve sınırlarını belirtme.
Bu adımlar tek seferlik değil, bir döngüdür: değerlendirme çoğu zaman yeni sorular doğurur ve süreç baştan işler.
"Şehirdeki gençler hangi müziği seviyor?" sorusu için araştırmanın ilk adımı nedir?
- İlk adım, araştırılacak soruyu netleştirmektir (hedef kitle ve ölçülecek özellik belli olmalı).
2. Örneklem ve Temsil Edicilik
Tüm kitleye (evren) ulaşmak çoğu zaman zordur; bunun yerine bir örneklem seçilir. Örneklemin güvenilir olması için:
- Temsil edici olmalı (evrenin yapısını yansıtmalı),
- Yeterince büyük olmalı,
- Rastgele seçilmeli (taraflı seçim yanlılık doğurur).
Bir okulun tüm öğrencilerinin spor alışkanlığını öğrenmek için yalnız basketbol takımıyla anket yapmak uygun mudur?
Seçilen grup, tüm öğrencileri (evreni) yansıtıyor mu? diye sor.
- Basketbol takımı zaten sporla ilgili bir gruptur; tüm öğrencileri temsil etmez.
- Bu, taraflı (yanlı) örneklemdir; sonuç gerçeği abartır.
3. Veri Toplama Yöntemleri
- Anket / gözlem: sorularla ya da doğrudan gözlemle veri toplama.
- Sayısal (nicel) veri: ölçülen sayılar (boy, süre).
- Kategorik (nitel) veri: gruplar (renk, cinsiyet, evet/hayır).
Soruların açık ve yönlendirmesiz olması önemlidir; yönlendirici soru yanlı veri üretir.
"Sağlıklı yaşamı önemseyen biri olarak haftada kaç gün spor yaparsın?" sorusu neden sorunludur?
- Soru, kişiyi "sağlıklı yaşamı önemseyen" diye etiketleyerek yönlendiriyor.
- Bu, yanıtı yukarı çeker → yanlı veri.
4. Bulguları Değerlendirme
Sonucu sunarken sınırlarını belirtmek gerekir: örneklem küçükse ya da temsil edici değilse, sonuç tüm evrene genellenemez. İyi bir değerlendirme, "ne bulundu" kadar "ne kadar güvenilir" sorusunu da yanıtlar.
30 kişilik bir sınıfta yapılan ankete göre "ülkedeki gençlerin \%80'i kitap okuyor" sonucu çıkarılıyor. Bu değerlendirme doğru mudur?
30kişilik tek bir sınıf, ülkedeki tüm gençleri temsil etmez.- Sonuç bu sınıf için geçerli olabilir ama ülkeye genellenemez.
Çözümlü Örnekler
Bir araştırmada veri toplandıktan sonra gelen adım nedir?
- Süreç: soru → veri toplama → bulgulara ulaşma (özetleme) → değerlendirme.
"Göz rengi" verisi nicel mi kategorik mi bir değişkendir?
- Göz rengi gruplara ayrılır (kahve, mavi...), ölçülen bir sayı değildir.
Bir alışveriş merkezinde yalnız hafta içi öğleden önce anket yapılırsa hangi grup eksik temsil edilir?
- Hafta içi öğleden önce çoğu çalışan ve öğrenci orada olamaz.
- Bu gruplar eksik temsil edilir → örneklem yanlı olur.
Bir örneklemi güvenilir kılan üç özelliği yazınız.
- Temsil edici olması, yeterince büyük olması, rastgele seçilmesi.
Alıştırmalar — Sıra Sende
Önce kendin çözmeyi dene; sonra çözümü açıp karşılaştır.
"Bir kişinin aylık geliri" nicel mi kategorik mi bir değişkendir?
- Ölçülen bir sayıdır → nicel.
Araştırma sürecinin ilk adımı nedir?
- Net bir araştırma sorusu belirlemek.
Sadece bir spor kulübünün üyeleriyle "halkın spor alışkanlığı" araştırılırsa sorun nedir?
- Örneklem temsil edici değil; yanlı sonuç verir.
"Bu harika ürünü ne sıklıkla alırsınız?" sorusunun kusuru nedir?
- "Harika" kelimesi yönlendiricidir → taraflı soru.
"Ailedeki çocuk sayısı" verisi nicel mi kategorik mi bir değişkendir?
- Ölçüt: değer sayılan/ölçülen bir sayı mı, yoksa bir etiket/grup mu?
- Çocuk sayısı sayılan bir sayıdır (
0, 1, 2, \dots) → nicel (kesikli).
Bir gazete, web sitesine "En sevdiğiniz parti hangisi?" anketi koyuyor ve yalnız oy verenlerin yanıtlarını topluyor. Bu örneklem neden yanlı olabilir?
Ankete kimler katılıyor? Yalnız siteyi ziyaret edip oylamayı seçenler. Bu grup tüm seçmeni temsil eder mi?
- Yalnız o gazetenin sitesini okuyan ve gönüllü oy veren kişiler katılır.
- Bu, gönüllü yanıt (öz-seçim) yanlılığıdır: belirli bir kesim aşırı temsil edilir, evren temsil edilmez.
Bir araştırmacı 500 kişilik rastgele bir örneklemle ülke genelinde anket yapıyor; ikinci araştırmacı ise yalnız kendi mahallesindeki 500 kişiyle anket yapıyor. İki örneklem de aynı büyüklükte olduğuna göre hangisi daha güvenilirdir ve neden?
Büyüklük tek başına yetmez; temsil edicilik ve rastgelelik de gerekir.
- İki örneklem de
500kişilik; yani büyüklük aynı. - Birincisi ülke genelinden rastgele seçildiğinden evreni temsil eder; ikincisi tek mahalleyle sınırlı olduğundan ülkeyi temsil etmez (coğrafi yanlılık).
- Demek ki güvenilirliği belirleyen büyüklük değil, temsil edicilik ve rastgeleliktir.
Bir araştırma "öğrencilerin \%90'ı okuldan memnun" sonucunu, yalnız okul yönetiminin seçtiği 20 başarılı öğrenciyle yaptığı görüşmeye dayandırıyor. Bu sonucu hangi iki gerekçeyle eleştirirsin?
Hem örneklem büyüklüğüne hem de örneklemin nasıl seçildiğine bak.
- Örneklem çok küçük (
20kişi) — tüm öğrencilere genellenemez. - Örneklem yönetimce, başarılı öğrencilerden seçilmiş; rastgele değil → seçim yanlılığı. Bu grup memnuniyeti olduğundan yüksek gösterir.
- Dolayısıyla
\%90sonucu ne büyüklük ne de temsil edicilik bakımından güvenilirdir.
Sık Yapılan Hatalar
- Yanlı örneklemden genelleme yapmak. Temsil etmeyen bir gruptan tüm evrene sonuç çıkarılamaz.
- Nicel ile kategorik değişkeni karıştırmak. Ölçülen sayı → nicel; gruplandırma → kategorik.
- Yönlendirici soru sormak. Soru tarafsız olmalı; etiket/sıfat içeren sorular yanıtı çarpıtır.
- Büyük örneklemi otomatik güvenilir sanmak. Büyüklük tek başına yetmez; örneklem rastgele ve temsil edici değilse büyüklük yanlılığı düzeltmez (tek mahalleden
5000kişi de ülkeyi temsil etmez). - Gönüllü yanıtı rastgele örneklem sanmak. İnternet anketleri gibi "isteyen katılsın" yöntemleri öz-seçim yanlılığı taşır; belirli bir kesim aşırı temsil edilir.
- Sonucun sınırını belirtmemek. İyi değerlendirme, örneklem büyüklüğü ve temsil ediciliği üzerinden güvenilirliği de söyler.
Not: Bir araştırmayı değerlendirirken üç soru: Örneklem evreni temsil ediyor mu? Sorular tarafsız mı? Sonuç hangi gruba genellenebilir? İyi süreç, güvenilir bulgunun ön koşuludur.