Kategorik veri, niceliksel (sayısal) bir değer ifade etmek yerine, bir kategoriyi veya grubu temsil eden veridir. Başka bir deyişle, nesneleri veya bireyleri belirli özelliklere göre sınıflandırmak için kullanılır. Bu özellikler sayısal olabileceği gibi (örneğin, bir anketteki 1'den 5'e kadar olan derecelendirmeler), genellikle sözel veya semboliktir.
Kategorik veriler, temelde iki ana türe ayrılır:
Nominal veriler, sadece isim veya etiketlerden oluşur. Kategoriler arasında herhangi bir üstünlük veya derecelendirme söz konusu değildir. Örneğin:
Bu örneklerde, herhangi bir araba markasının diğerinden daha "iyi" veya herhangi bir rengin diğerinden daha "önemli" olduğunu söyleyemeyiz. Sadece farklı kategorilerdir.
Ordinal verilerde ise, kategoriler arasında belirli bir sıralama vardır. Ancak, kategoriler arasındaki mesafenin eşit olması gerekmez. Örneğin:
Bu örneklerde, "Çok Memnun" kategorisi "Memnun" kategorisinden daha yüksek bir memnuniyet düzeyini temsil eder. Benzer şekilde, "Lise" eğitim seviyesi "Ortaokul" seviyesinden daha yüksektir. Ancak, "Memnun" ve "Çok Memnun" arasındaki memnuniyet farkı ile "Nötr" ve "Memnun Değil" arasındaki memnuniyet farkı aynı olmayabilir.
Kategorik verilerin analizi, sayısal verilerden farklı yöntemler gerektirir. Sık kullanılan bazı yöntemler şunlardır:
Kategorik veri, birçok alanda büyük öneme sahiptir. Anketlerden elde edilen verilerin analizinde, müşteri davranışlarını anlamada, pazar araştırmalarında ve daha birçok uygulamada kullanılır. Kategorik veriyi doğru bir şekilde anlamak ve analiz etmek, doğru kararlar vermek ve etkili stratejiler geliştirmek için kritik öneme sahiptir.