İçeriğe atla
Üyelik kaydınızı yaparak son yazılan içeriklerden haberdar olun! ×
  • makale
    25
  • yorum
    0
  • görüntüleme
    16.981

Scatterplot


Doğuhan ELMA

145 görünüm

Scatterplot, iki değişken veya özellik arasındaki ilişkiyi görsel olarak temsil eden bir grafik türüdür. Her bir veri noktası, bir eksen üzerinde bir değişkeni ve diğer eksen üzerinde diğer değişkeni temsil eder. Scatterplot, veri noktalarının dağılımını incelemek ve iki değişken arasındaki ilişkiyi anlamak için kullanılır.

Scatterplot'ün temel özellikleri:

Değişkenlerin İlişkisi: Scatterplot, iki değişken veya özellik arasındaki ilişkiyi görsel olarak gösterir. İki değişken arasındaki bağımlılığı, korelasyonu veya dağılımın yapısal özelliklerini incelemek için kullanılır.

Her Bir Nokta Bir Veriyi Temsil Eder: Her nokta, veri setinde bir gözlemi veya bir veri noktasını temsil eder. Bu noktalar, grafik üzerinde iki eksen aracılığıyla yerleştirilir.

Noktaların Dağılımı: Noktaların dağılımı, verilerin yoğunluğunu, yayılımını ve dağılım şeklini gösterir. Noktaların nasıl gruplandığı veya dağıldığı bilgi verir.

Trend ve Korelasyon Analizi: Scatterplot, iki değişken arasındaki trendi veya korelasyonu belirlemek için kullanılır. İki değişken arasındaki ilişki pozitif mi, negatif mi veya belirgin bir ilişki yok mu gibi soruları yanıtlamak için kullanılır.

Scatterplot, özellikle istatistiksel analizler ve veri madenciliği çalışmalarında yaygın olarak kullanılır. İki değişkenin karşılaştırılması, aykırı değerlerin tespit edilmesi, dağılımın incelenmesi ve veri setinin genel yapısının anlaşılması için önemli bir görsel araçtır. Ayrıca, iki değişken arasındaki ilişkinin görsel analizi, tahmin modelleri oluşturulması veya veri keşfi için temel bir adımdır.

import matplotlib.pyplot as plt
import numpy as np

# Örnek veri oluşturma
x = np.random.rand(50)  # x ekseni için rastgele veri
y = 2 * x + 1 + np.random.rand(50)  # y ekseni için rastgele veri, x ile lineer ilişkili

# Scatterplot çizimi
plt.figure(figsize=(8, 6))  # Grafiğin boyutunu ayarla
plt.scatter(x, y, color='blue', marker='o', label='Veri Noktaları')  # Nokta grafiği çiz
plt.xlabel('X Değeri')  # X ekseni etiketi
plt.ylabel('Y Değeri')  # Y ekseni etiketi
plt.title('Scatterplot Örneği')  # Başlık ekle
plt.legend(loc='upper left')  # Açıklama eklemek için

# Grafiği göster
plt.show()

Çıktı:

1.png

Bu örnekte, x ve y arasında bir lineer ilişki bulunur, bu nedenle noktaların bir çizgi boyunca toplandığını görmekteyiz. Gerçek veri setinizle aynı mantığı kullanarak scatterplot oluşturabilir ve değişkenler arasındaki ilişkiyi görsel olarak analiz edebilirsiniz.

Metrikler:

Değişkenlerin İlişkisi: İlk olarak, scatterplot'ün genel şekline bakarak iki değişken arasındaki ilişkiyi anlamaya çalışın. Noktalar rastgele dağılmış mı yoksa belirli bir düzen mi izliyor?

Yatay Eksen (X Değeri): X eksenindeki değerler, ilk değişkeni temsil eder. Yatay eksendeki noktaların dağılımı ve yoğunluğu hakkında bilgi verir.

Dikey Eksen (Y Değeri): Y eksenindeki değerler, ikinci değişkeni temsil eder. Dikey eksendeki noktaların dağılımı ve yoğunluğu hakkında bilgi verir.

Korelasyon: Noktaların genel eğilimini inceleyerek iki değişken arasındaki korelasyonu (ilişkiyi) anlamaya çalışın. Pozitif bir korelasyon, noktaların yukarı doğru bir eğilim göstermesi demektir. Negatif bir korelasyon, noktaların aşağı doğru bir eğilim göstermesi demektir. Korelasyon olmayan bir ilişkide noktalar rastgele dağılmış olur.

Konsantrasyon ve Dağılım: Noktaların yoğunlaşma şekli ve ne kadar yayıldığı hakkında bilgi alabilirsiniz. Yoğun bir grup, iki değişken arasında güçlü bir ilişkiyi gösterebilir.

Outlier'lar (Aykırı Değerler): Noktaların dışında kalan veri noktaları aykırı değerleri temsil edebilir. Bu noktalar, diğer veri noktalarından büyük ölçüde farklı değerlere sahiptir.

Değişkenlerin Dağılımı: Her değişkenin kendi dağılımını incelemek için scatterplot'i kullanabilirsiniz. X eksenindeki verilerin dağılımı ve yoğunluğu ile aynı şey Y ekseni için de geçerlidir.

Scatterplot metrikleri, iki değişken arasındaki ilişkiyi daha iyi anlamak için kullanılır. Korelasyon katsayısı (örneğin, Pearson korelasyon katsayısı), iki değişken arasındaki ilişkiyi nicel olarak ölçmek için kullanılan bir metrik olabilir. Ayrıca, noktaların yoğunluk dağılımı hakkında bilgi edinmek için lokal yoğunluk analizleri gibi yöntemler kullanılabilir.

Scatterplot'ü inceleyerek veri setinizin özelliklerini ve değişkenler arasındaki ilişkiyi daha iyi anlayabilir ve gelecekteki analizleriniz için önemli bilgiler elde edebilirsiniz.

0 Yorum


Önerilen Yorumlar

Görüntülenecek yorum yok.

Misafir
Yorum ekle...

×   Zengin metin olarak yapıştırıldı.   Bunun yerine düz metin olarak yapıştır

  Yalnızca 75 emojiye izin verilir.

×   Bağlantınız otomatik olarak gömüldü.   Bunun yerine bağlantı olarak görüntüle

×   Önceki içeriğiniz geri yüklendi.   Düzenleyiciyi temizle

×   Görüntüleri doğrudan yapıştıramazsınız. URL'den resim yükleyin veya ekleyin.

×
×
  • Create New...