İçeriğe atla
Üyelik kaydınızı yaparak son yazılan içeriklerden haberdar olun! ×
  • makale
    25
  • yorum
    0
  • görüntüleme
    16.981

Kategorik Verinin Gösterimi(Displaying Data)


Doğuhan ELMA

221 görünüm

İstatistik, verilerin toplanması, analizi, yorumlanması veya açıklanması ve sunulmasıyla ilgilenen bir matematik bilimidir. Uygun şekilde kullanılan istatistiksel ilkeler, verilerle desteklenen herhangi bir araştırmaya rehberlik etmede esastır ve özellikle veri araştırması aşamasında rutin olarak keşif ve yenilik için temel bir kaynaktır. Verilerden elde edilen bilgiler, verilerin iyi tasarlanmış bir görselleştirmesinden, modern istatistiksel öğrenme yöntemlerinden ve model seçiminin yanı sıra geleneksel resmi istatistiksel prosedürlerden de gelebilir. Verilerle ilk karşılaşmalar grafiksel gösterimler ve sayısal özetler aracılığıyla gerçekleşir. Amaç, bu sunum için aynı zamanda hem nesnel hem de bilgilendirici olan zarif bir yöntem bulmaktır; verilerin göze çarpan özelliklerini birkaç satır veya birkaç rakamla açıklığa kavuşturmaktır. Bu anlamda veri sunumu aynı zamanda bir sanat, bir bilim ve tarafsızlık yükümlülüğüdür.

 

Verilerin doğası ve karakteristiklerine göre farklı türde sınıflandırıldığı dört temel veri türü vardır:

Nominal Veri:

Nominal veri, ayrı öğeleri veya kategorileri temsil eder. Nominal verilerin doğal bir sırası veya sıralaması yoktur. Örnekler arasında cinsiyet (erkek, kadın), renkler (kırmızı, mavi, yeşil) ve hayvan türleri (köpek, kedi, kuş) bulunur. Nominal verilerde matematiksel işlemler (toplama veya çıkarma gibi) anlamlı değildir.

Sıralı Veri:

Sıralı veri, kategoriler arasında doğal bir sıralamanın veya sıralamanın olduğu kategorileri temsil eder. Aralıklar eşit olmak zorunda değildir, ancak sıralı veri, bir kategorinin diğerinden yüksek veya düşük olduğunu gösterir. Örnekler arasında eğitim seviyeleri (örneğin, ilkokul, lise, lisans), müşteri memnuniyeti derecelendirmeleri (çok memnun, memnun, tarafsız, memnun değil, çok memnun değil) ve ekonomik durum (düşük gelir, orta gelir, yüksek gelir) bulunur.

Aralıklı Veri:

Aralıklı verilerin anlamlı bir sıralaması vardır ve aralıklar tutarlıdır, ancak gerçek bir sıfır noktası yoktur. Bu, toplama veya çıkarmayı içeren matematiksel işlemlerin yapılabilmesi anlamına gelir, ancak bölme ve çarpma anlamlı değildir. Örnekler arasında Celsius veya Fahrenheit derecesi ile ölçülen sıcaklık ve IQ puanları bulunur. Aralıklı verilerde sıfır, ölçümün başladığı yerin işaretidir, ancak sıfırın kendisi yoktur.

Oran Veri:

Oran verileri, anlamlı bir sıralamaya, tutarlı aralıklara ve gerçek bir sıfır noktasına sahiptir. Bu, tüm matematiksel işlemlerin (toplama, çıkarma, çarpma, bölme) yapılabilmesi anlamına gelir. Örnekler arasında boy, ağırlık, gelir, yaş ve sayılar yer alır. Oran verilerinde sıfır, ölçümün tamamen olmadığını gösterir.

Hangi türde veri ile çalıştığınızı anlamak, uygun istatistiksel analiz yöntemlerini ve görselleştirmeleri seçerken önemlidir. Farklı veri türleri, verilerin işlenmesi, özetlenmesi ve yorumlanması açısından farklı yaklaşımlar gerektirir.

 

Kategorik Veri:

belirli kategorilere veya sınıflara ait olan verileri temsil eder. Bu veriler, genellikle kategori, tip veya sınıf gibi adlar altında gruplandırılır ve özel bir sıralama veya sayısal değeri yoktur. Kategorik veriler sıklıkla niteliksel veriler olarak da adlandırılır ve istatistiksel analizlerde özel bir öneme sahiptir. İşte kategorik verilerin temel özellikleri:

Kategoriler veya Sınıflar: Kategorik veriler, farklı sınıflar veya kategoriler arasında gruplandırılır. Örnekler arasında cinsiyet (erkek, kadın), renkler (kırmızı, mavi, yeşil), ürün kategorileri (giyim, elektronik, gıda), coğrafi bölgeler (şehir, ilçe, köy) ve eğitim seviyeleri (ilkokul, lise, lisans) gibi kategoriler bulunabilir.

Sıralama Yok: Kategorik verilerin kendilerine özgü bir sıralaması yoktur. Yani, bir kategori diğerinden "daha büyük" veya "daha küçük" değil, sadece farklıdır.

Niteliksel Bilgi: Kategorik veriler, bir şeyin ne olduğunu veya hangi kategoriye ait olduğunu belirtir. Sayısal değerler veya niceliksel ölçümler içermezler.

Kategorik verilerin analizi, genellikle frekans dağılımları, çubuk grafikleri, pasta grafikleri ve kategoriye göre yüzdelik dağılımları içeren istatistiksel ve görsel yöntemlerle yapılır. Bu veriler, pazar araştırmaları, demografik analizler, sınıflandırma problemleri ve kualitatif analizler gibi birçok alanda kullanılır. Kategorik veriler, verileri açıklamak, sınıflandırmak ve ilişkileri anlamak için önemli bir bileşen olarak işlev görür.

 

1. Pasta Grafiği:  

Pasta grafiği veya dilim grafiği olarak da bilinen "Pie Chart" (Tartı Grafiği), verilerin kategorik dağılımını veya oransal bölümlerini temsil etmek için kullanılan bir veri görselleştirme aracıdır. Pasta grafiği, veri setindeki her kategorinin toplam içindeki oransal payını gösterir. Bu grafiği anlamak oldukça basittir, çünkü bir pasta gibi dilimlere ayrılmıştır.

Pasta grafiği aşağıdaki temel özelliklere sahiptir:

Dilimler (Slices): Pasta grafiği, bir dairenin dilimler halinde bölünmesiyle oluşturulur. Her dilim, bir veri kategorisini temsil eder.

Oranlar (Ratios): Pasta grafiği, her kategori diliminin, veri setindeki toplamın ne kadarını temsil ettiğini gösterir. Bu, görsel olarak verilerin oransal dağılımını anlamamıza yardımcı olur.

Toplamın %100'ü:  Pasta grafiğinin tamamı, veri setindeki tüm kategorilerin toplamını temsil eder. Bu nedenle, tüm dilimlerin toplamı %100 olmalıdır.

Pasta grafikleri, özellikle veri setindeki kategorilerin oranlarını karşılaştırmak veya görsel olarak vurgulamak istediğinizde kullanışlıdır. Örneğin, bir anket sonuçlarını temsil etmek, bir ürünün pazar payını göstermek veya bir bütçenin harcama dağılımını analiz etmek için pasta grafikleri yaygın olarak kullanılır.

Ancak, pasta grafikleri çok fazla kategori içerdiğinde veya veriler karmaşık olduğunda okunması zor olabilir. Bu nedenle, daha az kategori veya daha basit veri görselleştirmeleri için daha uygundur.

Kod:

import matplotlib.pyplot as plt
import pandas as pd

# Veri oluşturma (örnek veri)
veri = {'Kategori': ['A', 'B', 'C', 'D', 'E'],
        'Değerler': [30, 25, 20, 15, 10]}

veri_df = pd.DataFrame(veri)

# Pasta grafiği çizimi
plt.figure(figsize=(8, 8))  # Grafiğin boyutunu ayarla
plt.pie(veri_df['Değerler'], labels=veri_df['Kategori'], autopct='%1.1f%%', startangle=140)
plt.title('Kategori Dağılımı')  # Başlık ekle
plt.axis('equal')  # Daireyi daire olarak çizdir

# Pasta grafiğini göster veya kaydet
plt.show()  # Grafiği ekranda göster
# plt.savefig('pasta_grafik.png')  # Grafiği dosyaya kaydetmek isterseniz bu satırı kullanabilirsiniz

Çıktı:

1.png

2. Bar Grafiği:

Bar grafiği veya çubuk grafiği, verileri sütunlara (çubuklara) dökme şeklinde temsil eden bir veri görselleştirme türüdür. Bu grafik, veri kategorilerinin veya değişkenlerinin karşılaştırılması ve görsel analizi için kullanılır. Bar grafikleri, her bir kategori veya değişken için dikey veya yatay sütunların uzunluğunu kullanarak verileri gösterir.

Bar grafiği özellikleri:

Kategorilerin Karşılaştırılması: Bar grafikleri, belirli kategorilerin veya değişkenlerin göreceli büyüklüklerini veya ilişkilerini karşılaştırmak için kullanılır. Her bir sütun, bir kategori veya değişkeni temsil eder.

Düşey ve Yatay Seçenekler: Bar grafikleri hem dikey (yükselen sütunlar) hem de yatay (yatay sütunlar) olarak oluşturulabilir. Grafik tipi, verilerin daha iyi görsel anlatılmasına bağlı olarak seçilir.

Kategori veya Değişken Etiketleri: Her sütun genellikle bir etiketle (kategorinin veya değişkenin adı) ilişkilendirilir, böylece okuyucu hangi sütunun neyi temsil ettiğini anlayabilir.

Oransal Gösterim: Sütunların uzunluğu, temsil ettikleri verilerin miktarını yansıtır. Dolayısıyla, sütunların uzunlukları arasındaki göreceli farklar, veri değerlerinin karşılaştırılması için kullanılır.

Bar grafikleri, popülasyon dağılımları, gelir sınıflandırmaları, ürün satışları, oy verme sonuçları ve benzeri birçok konuda verileri görselleştirmek için yaygın olarak kullanılır. Verilerin karşılaştırılması ve önemli özelliklerin belirtilmesi gereken herhangi bir durumda kullanışlıdır.

Kod:

import matplotlib.pyplot as plt

# Veri oluşturma (örnek veri)
kategoriler = ['Kategori A', 'Kategori B', 'Kategori C', 'Kategori D', 'Kategori E']
veriler = [30, 45, 55, 25, 60]

# Çubuk grafik çizimi
plt.figure(figsize=(8, 6))  # Grafiğin boyutunu ayarla
plt.bar(kategoriler, veriler, color='skyblue')  # Çubukları çiz
plt.xlabel('Kategoriler')  # X ekseni etiketi
plt.ylabel('Değerler')  # Y ekseni etiketi
plt.title('Kategorik Değerlerin Çubuk Grafiği')  # Başlık ekle
plt.xticks(rotation=45)  # X ekseni etiketlerini 45 derece döndür

# Grafiği göster
plt.show()

Çıktı:

1.png

 

0 Yorum


Önerilen Yorumlar

Görüntülenecek yorum yok.

Misafir
Yorum ekle...

×   Zengin metin olarak yapıştırıldı.   Bunun yerine düz metin olarak yapıştır

  Yalnızca 75 emojiye izin verilir.

×   Bağlantınız otomatik olarak gömüldü.   Bunun yerine bağlantı olarak görüntüle

×   Önceki içeriğiniz geri yüklendi.   Düzenleyiciyi temizle

×   Görüntüleri doğrudan yapıştıramazsınız. URL'den resim yükleyin veya ekleyin.

×
×
  • Create New...