Bu konu, tek nicel değişkenli veri setlerinin başkaları tarafından sunulan dağılımlarını anlamayı, yorumlamayı ve eleştirel bir bakış açısıyla tartışmayı içerir. Veri analizinde, özellikle istatistiksel sonuçların doğruluğunu ve geçerliliğini değerlendirmek önemlidir.
Tek nicel değişkenli veri, sayısal değerlerle ifade edilen ve bir özelliğe ait ölçümlerin dağılımını gösteren veri türüdür. Örnekler:
Bir veri dağılımını tartışırken şu unsurlara dikkat edilmelidir:
Örnek: "Bu veri setinde ortalama 75, medyan 68 ise, dağılımın sağa çarpık olduğu ve yüksek notlu birkaç öğrencinin ortalamayı yukarı çektiği söylenebilir."
1. Bir veri dağılımının merkezi eğilimini ölçmek için kullanılan üç temel ölçüt ________, ________ ve ________'dir.
2. Veri dağılımının yayılımını ölçmek için ________ ve ________ gibi istatistikler kullanılabilir.
Aşağıdaki terimleri tanımlarıyla eşleştirin:
1. ( ) Bir veri setinde aykırı değerler medyanı etkilerken aritmetik ortalamayı etkilemez.
2. ( ) Standart sapma ne kadar büyükse veriler o kadar az yayılım gösterir.
1. Bir araştırmacı, öğrencilerin matematik sınav puanlarının aritmetik ortalamasını 75 olarak bulmuştur. Bu sonuca dayanarak "Öğrencilerin çoğu 75 puan almıştır" yorumu doğru mudur? Neden?
2. Aşağıdaki veri seti için medyan ve ranjı hesaplayınız: 12, 15, 18, 22, 24, 27, 30
1. Hangisi bir veri dağılımının merkezi eğilim ölçüsü DEĞİLDİR?
a) Mod b) Medyan c) Ranj d) Aritmetik ortalama
2. Aşağıdakilerden hangisi verilerin yayılımını gösterir?
a) Ortalama b) Standart sapma c) Mod d) Medyan
Cevaplar:
1: ortalama, medyan, mod
2: ranj, standart sapma
A:3, B:4, C:1, D:2
1: Yanlış, 2: Yanlış
1: Hayır, çünkü ortalama tek başına dağılım hakkında bilgi vermez.
2: Medyan: 22, Ranj: 18
1: c, 2: b
Soru 1: Bir araştırmada, 50 öğrencinin matematik sınav puanlarına göre oluşturulan histogramda verilerin sağa çarpık olduğu gözlemlenmiştir. Bu dağılımla ilgili aşağıdaki yorumlardan hangisi yanlıştır?
a) Çoğu öğrenci düşük puan almıştır.
b) Ortalama puan, medyandan küçüktür.
c) Yüksek puan alan öğrenci sayısı azdır.
d) Dağılımın modu, medyanın solundadır.
e) Verilerin çeyrekler açıklığı simetriktir.
Cevap: e) Sağa çarpık dağılımlarda çeyrekler açıklığı simetrik olmak zorunda değildir. Diğer seçenekler sağa çarpık dağılımın temel özellikleridir.
Soru 2: Aşağıdaki kutu grafiği, iki farklı şehirdeki günlük ortalama sıcaklık dağılımlarını göstermektedir. Grafiğe göre hangi yorum doğrudur?
a) 1. şehirdeki sıcaklıkların varyansı daha büyüktür.
b) 2. şehirdeki veriler tamamen simetriktir.
c) 1. şehirde aykırı değer yoktur.
d) 2. şehirdeki medyan sıcaklık daha yüksektir.
e) Her iki şehirde de veri aralığı aynıdır.
Cevap: d) Kutu grafiğinde medyan değeri (kutudaki çizgi) 2. şehirde daha yukarıda olduğu için bu yorum doğrudur. Diğer seçenekler grafikten çıkarılamaz.
Soru 3: Bir makalede "Grup A'nın test puanlarının standart sapması, Grup B'ninkinden küçüktür" ifadesi yer alıyor. Bu durumla ilgili:
a) Grup A'daki öğrenciler daha başarılıdır.
b) Grup B'nin puanları daha homojendir.
c) Grup A'nın puanları ortalamaya daha yakın dağılmıştır.
d) Grup B'nin aritmetik ortalaması daha yüksektir.
e) Grup A'da aykırı değer yoktur.
Cevap: c) Standart sapmanın küçük olması, verilerin ortalamaya yakın dağıldığını gösterir. Diğer seçenekler bu bilgiyle doğrulanamaz.
Soru 4: Bir araştırmacı, oluşturduğu saçılım diyagramında \( r = 0.92 \) korelasyon katsayısı elde etmiştir. Buna göre:
a) Değişkenler arasında negatif ilişki vardır.
b) İlişkinin gücü zayıftır.
c) Grafikte noktalar doğrusal bir çizgiye yakındır.
d) Korelasyon nedensellik gösterir.
e) Katsayı anlamlı değildir.
Cevap: c) 0.92 gibi yüksek bir korelasyon, noktaların doğrusal bir çizgiye yakın olduğunu gösterir. Diğer seçenekler yanlıştır (a: pozitif, b: güçlü, d: nedensellik gösterilmez, e: anlamlıdır).