Korelasyon (Correlation) ve Kovaryans(Covariance)
Kovaryans ve korelasyon, iki değişken arasındaki ilişkiyi ölçen iki farklı istatistiksel kavramdır. İşte her birinin açıklamaları ve farkları:
Kovaryans:
Kovaryans, iki rassal değişken arasındaki ilişkinin doğasını ölçen bir terimdir. İki değişken arasındaki eğilimlerin aynı yönde mi yoksa ters yönde mi olduğunu belirlemeye yardımcı olur. Kovaryans pozitif, negatif veya sıfır olabilir.
Pozitif Kovaryans: İki değişken arasında pozitif bir kovaryans varsa, bu, bir değişkenin arttığında diğerinin de artma eğiliminde olduğu anlamına gelir.
Negatif Kovaryans: İki değişken arasında negatif bir kovaryans varsa, bu, bir değişkenin arttığında diğerinin azalma eğiliminde olduğu anlamına gelir.
Sıfır Kovaryans: İki değişken arasında kovaryans sıfırsa, bu, iki değişken arasında herhangi bir belirgin ilişki olmadığını gösterir.
Kovaryansın dezavantajı, iki değişkenin ölçeklerine bağlı olarak değişmesidir. Bu nedenle kovaryansın yorumlanması bazen zor olabilir. Kovaryansın birimi, iki değişkenin birimlerinin çarpımıdır.
Korelasyon:
Korelasyon, kovaryansın ölçek bağımsız bir versiyonudur ve iki değişken arasındaki ilişkinin doğasını daha açık bir şekilde ölçer. Korelasyon, kovaryansın standart sapmalara bölünmesi ile hesaplanır. İki yaygın korelasyon ölçüsü vardır: Pearson Korelasyon Katsayısı ve Spearman Rank Korelasyon Katsayısı.
Pearson Korelasyon Katsayısı: Pearson korelasyonu, iki sürekli değişken arasındaki doğrusal ilişkiyi ölçer. Değişkenler arasındaki ilişki pozitif, negatif veya sıfır olabilir. Pearson korelasyonu -1 ile 1 arasında bir değer alır. 1, mükemmel pozitif korelasyonu, -1 mükemmel negatif korelasyonu ve 0 hiçbir korelasyonu temsil eder.
Spearman Rank Korelasyon Katsayısı: Spearman korelasyonu, iki değişken arasındaki ilişkiyi ölçer, ancak bu ilişki doğrusal olmak zorunda değildir. Bu korelasyon türü, değişkenlerin sıralamalarını kullanır ve bu nedenle daha genel bir ilişkiyi tespit edebilir.
Korelasyon, iki değişken arasındaki ilişkiyi daha açık ve anlaşılır bir şekilde ölçer ve kovaryansın ölçek bağımlılığını ortadan kaldırır. Korelasyon genellikle iki değişken arasındaki ilişkinin gücünü ve yönünü değerlendirmek için tercih edilen bir ölçüdür. İstatistiksel analizlerde ve veri bilimi projelerinde sıkça kullanılır.
Kovaryans ve korelasyon kavramlarını bir örnek ile açıklayalım:
Örnek: Bir Şirketin Reklam Harcamaları ve Satışları Arasındaki İlişkiyi İncelemek
Diyelim ki bir şirket, reklam harcamalarının satışları nasıl etkilediğini anlamak istiyor. İşte reklam harcamaları (X) ve satışlar (Y) verileri için örnek bir veri seti:
Reklam Harcamaları (X): [100, 200, 300, 400, 500] Satışlar (Y): [1500, 2200, 2800, 3500, 4000]
Bu verileri kullanarak kovaryans ve korelasyon hesaplamaları yapabiliriz:
Kovaryans Hesaplama: Kovaryans, iki değişken arasındaki ilişkinin doğasını ölçer. Kovaryans formülü şu şekildedir:
Kovaryans = Σ((Xi - X̄) * (Yi - Ȳ)) / (n - 1)
Burada:
Xi ve Yi, veri noktalarıdır.
X̄ ve Ȳ, sırasıyla X ve Y değişkenlerinin ortalamalarını temsil eder.
n, veri noktalarının sayısını gösterir.
Bu örnekte, X̄ = 300 (reklam harcamalarının ortalaması) ve Ȳ = 2800 (satışların ortalaması) olarak hesaplayabiliriz. Kovaryansı hesaplamak için:
Kovaryans = ((100-300) * (1500-2800) + (200-300) * (2200-2800) + (300-300) * (2800-2800) + (400-300) * (3500-2800) + (500-300) * (4000-2800)) / (5-1)
Kovaryans ≈ 41500
Korelasyon Hesaplama: Korelasyon, kovaryansın standart sapmalara bölünmesiyle hesaplanır. Pearson Korelasyon Katsayısı formülü şu şekildedir:
Korelasyon = Kovaryans / (σX * σY)
Burada:
Kovaryans, yukarıda hesapladığımız gibi.
σX, X değişkeninin standart sapması.
σY, Y değişkeninin standart sapması.
Standart sapma hesaplamak için aşağıdaki formülü kullanabiliriz:
σX = √[Σ((Xi - X̄)²) / (n - 1)] σY = √[Σ((Yi - Ȳ)²) / (n - 1)]
Bu örnekte, σX ≈ 158.11 ve σY ≈ 892.87 olarak hesaplanır. Son olarak, korelasyonu hesaplamak için:
Korelasyon ≈ 41500 / (158.11 * 892.87)
Korelasyon ≈ 0.926
Sonuçlar:
Kovaryans pozitif olduğu için, reklam harcamaları arttıkça satışların da arttığı bir pozitif ilişki vardır.
Korelasyon katsayısı 0.926 olduğu için, bu ilişki çok yüksek bir pozitif korelasyona işaret eder. Yani reklam harcamaları ile satışlar arasındaki ilişki oldukça güçlüdür.
Bu örnek, kovaryansın ve korelasyonun nasıl hesaplandığını ve iki değişken arasındaki ilişkiyi nasıl değerlendirdiğinizi göstermektedir. Korelasyon, iki değişken arasındaki ilişkiyi daha anlaşılır bir şekilde ifade eder ve ölçek bağımsızdır, bu nedenle tercih edilen bir istatistiksel ölçüdür.
import numpy as np import matplotlib.pyplot as plt # Verilerinizi tanımlayın reklam_harcamalari = np.array([100, 200, 300, 400, 500]) satislar = np.array([1500, 2200, 2800, 3500, 4000]) # Kovaryans hesaplama kovaryans = np.cov(reklam_harcamalari, satislar)[0, 1] # Korelasyon hesaplama (Pearson Korelasyon Katsayısı) korelasyon = np.corrcoef(reklam_harcamalari, satislar)[0, 1] # Verileri görselleştirme plt.scatter(reklam_harcamalari, satislar, label=f"Korelasyon = {korelasyon:.3f}") plt.xlabel("Reklam Harcamaları") plt.ylabel("Satışlar") plt.legend() plt.title("Reklam Harcamaları ile Satışlar Arasındaki İlişki") plt.grid(True) plt.show() print(f"Kovaryans: {kovaryans:.2f}") print(f"Korelasyon: {korelasyon:.3f}")
Kovaryans: 157500.00 Korelasyon: 0.999
0 Comments
Recommended Comments
There are no comments to display.