İçeriğe atla
Üyelik kaydınızı yaparak son yazılan içeriklerden haberdar olun! ×
  • makale
    25
  • yorum
    0
  • görüntüleme
    16.981

Korelasyon (Correlation) ve Kovaryans(Covariance)


Doğuhan ELMA

199 görünüm

Kovaryans ve korelasyon, iki değişken arasındaki ilişkiyi ölçen iki farklı istatistiksel kavramdır. İşte her birinin açıklamaları ve farkları:

Kovaryans:

Kovaryans, iki rassal değişken arasındaki ilişkinin doğasını ölçen bir terimdir. İki değişken arasındaki eğilimlerin aynı yönde mi yoksa ters yönde mi olduğunu belirlemeye yardımcı olur. Kovaryans pozitif, negatif veya sıfır olabilir.

Pozitif Kovaryans: İki değişken arasında pozitif bir kovaryans varsa, bu, bir değişkenin arttığında diğerinin de artma eğiliminde olduğu anlamına gelir.

Negatif Kovaryans: İki değişken arasında negatif bir kovaryans varsa, bu, bir değişkenin arttığında diğerinin azalma eğiliminde olduğu anlamına gelir.

Sıfır Kovaryans: İki değişken arasında kovaryans sıfırsa, bu, iki değişken arasında herhangi bir belirgin ilişki olmadığını gösterir.

Kovaryansın dezavantajı, iki değişkenin ölçeklerine bağlı olarak değişmesidir. Bu nedenle kovaryansın yorumlanması bazen zor olabilir. Kovaryansın birimi, iki değişkenin birimlerinin çarpımıdır.

Korelasyon:

Korelasyon, kovaryansın ölçek bağımsız bir versiyonudur ve iki değişken arasındaki ilişkinin doğasını daha açık bir şekilde ölçer. Korelasyon, kovaryansın standart sapmalara bölünmesi ile hesaplanır. İki yaygın korelasyon ölçüsü vardır: Pearson Korelasyon Katsayısı ve Spearman Rank Korelasyon Katsayısı.

Pearson Korelasyon Katsayısı: Pearson korelasyonu, iki sürekli değişken arasındaki doğrusal ilişkiyi ölçer. Değişkenler arasındaki ilişki pozitif, negatif veya sıfır olabilir. Pearson korelasyonu -1 ile 1 arasında bir değer alır. 1, mükemmel pozitif korelasyonu, -1 mükemmel negatif korelasyonu ve 0 hiçbir korelasyonu temsil eder.

Spearman Rank Korelasyon Katsayısı: Spearman korelasyonu, iki değişken arasındaki ilişkiyi ölçer, ancak bu ilişki doğrusal olmak zorunda değildir. Bu korelasyon türü, değişkenlerin sıralamalarını kullanır ve bu nedenle daha genel bir ilişkiyi tespit edebilir.

Korelasyon, iki değişken arasındaki ilişkiyi daha açık ve anlaşılır bir şekilde ölçer ve kovaryansın ölçek bağımlılığını ortadan kaldırır. Korelasyon genellikle iki değişken arasındaki ilişkinin gücünü ve yönünü değerlendirmek için tercih edilen bir ölçüdür. İstatistiksel analizlerde ve veri bilimi projelerinde sıkça kullanılır.

 

Kovaryans ve korelasyon kavramlarını bir örnek ile açıklayalım:

Örnek: Bir Şirketin Reklam Harcamaları ve Satışları Arasındaki İlişkiyi İncelemek

Diyelim ki bir şirket, reklam harcamalarının satışları nasıl etkilediğini anlamak istiyor. İşte reklam harcamaları (X) ve satışlar (Y) verileri için örnek bir veri seti:

Reklam Harcamaları (X): [100, 200, 300, 400, 500]
Satışlar (Y): [1500, 2200, 2800, 3500, 4000]

Bu verileri kullanarak kovaryans ve korelasyon hesaplamaları yapabiliriz:

Kovaryans Hesaplama: Kovaryans, iki değişken arasındaki ilişkinin doğasını ölçer. Kovaryans formülü şu şekildedir:

Kovaryans = Σ((Xi - X̄) * (Yi - Ȳ)) / (n - 1)

Burada:

Xi ve Yi, veri noktalarıdır.

X̄ ve Ȳ, sırasıyla X ve Y değişkenlerinin ortalamalarını temsil eder.

n, veri noktalarının sayısını gösterir.

Bu örnekte, X̄ = 300 (reklam harcamalarının ortalaması) ve Ȳ = 2800 (satışların ortalaması) olarak hesaplayabiliriz. Kovaryansı hesaplamak için:

Kovaryans = ((100-300) * (1500-2800) + (200-300) * (2200-2800) + (300-300) * (2800-2800) + (400-300) * (3500-2800) + (500-300) * (4000-2800)) / (5-1)

Kovaryans ≈ 41500

Korelasyon Hesaplama: Korelasyon, kovaryansın standart sapmalara bölünmesiyle hesaplanır. Pearson Korelasyon Katsayısı formülü şu şekildedir:

Korelasyon = Kovaryans / (σX * σY)

Burada:

Kovaryans, yukarıda hesapladığımız gibi.

σX, X değişkeninin standart sapması.

σY, Y değişkeninin standart sapması.

Standart sapma hesaplamak için aşağıdaki formülü kullanabiliriz:

σX = √[Σ((Xi - X̄)²) / (n - 1)] σY = √[Σ((Yi - Ȳ)²) / (n - 1)]

Bu örnekte, σX ≈ 158.11 ve σY ≈ 892.87 olarak hesaplanır. Son olarak, korelasyonu hesaplamak için:

Korelasyon ≈ 41500 / (158.11 * 892.87)

Korelasyon ≈ 0.926

Sonuçlar:

Kovaryans pozitif olduğu için, reklam harcamaları arttıkça satışların da arttığı bir pozitif ilişki vardır.

Korelasyon katsayısı 0.926 olduğu için, bu ilişki çok yüksek bir pozitif korelasyona işaret eder. Yani reklam harcamaları ile satışlar arasındaki ilişki oldukça güçlüdür.

Bu örnek, kovaryansın ve korelasyonun nasıl hesaplandığını ve iki değişken arasındaki ilişkiyi nasıl değerlendirdiğinizi göstermektedir. Korelasyon, iki değişken arasındaki ilişkiyi daha anlaşılır bir şekilde ifade eder ve ölçek bağımsızdır, bu nedenle tercih edilen bir istatistiksel ölçüdür.

 

import numpy as np
import matplotlib.pyplot as plt

# Verilerinizi tanımlayın
reklam_harcamalari = np.array([100, 200, 300, 400, 500])
satislar = np.array([1500, 2200, 2800, 3500, 4000])

# Kovaryans hesaplama
kovaryans = np.cov(reklam_harcamalari, satislar)[0, 1]

# Korelasyon hesaplama (Pearson Korelasyon Katsayısı)
korelasyon = np.corrcoef(reklam_harcamalari, satislar)[0, 1]

# Verileri görselleştirme
plt.scatter(reklam_harcamalari, satislar, label=f"Korelasyon = {korelasyon:.3f}")
plt.xlabel("Reklam Harcamaları")
plt.ylabel("Satışlar")
plt.legend()
plt.title("Reklam Harcamaları ile Satışlar Arasındaki İlişki")
plt.grid(True)
plt.show()

print(f"Kovaryans: {kovaryans:.2f}")
print(f"Korelasyon: {korelasyon:.3f}")
Kovaryans: 157500.00
Korelasyon: 0.999

1.png

1.png

 

0 Yorum


Önerilen Yorumlar

Görüntülenecek yorum yok.

Misafir
Yorum ekle...

×   Zengin metin olarak yapıştırıldı.   Bunun yerine düz metin olarak yapıştır

  Yalnızca 75 emojiye izin verilir.

×   Bağlantınız otomatik olarak gömüldü.   Bunun yerine bağlantı olarak görüntüle

×   Önceki içeriğiniz geri yüklendi.   Düzenleyiciyi temizle

×   Görüntüleri doğrudan yapıştıramazsınız. URL'den resim yükleyin veya ekleyin.

×
×
  • Create New...