Quantile-Quantile (Q-Q) Grafiği
Quantile-Quantile (Q-Q) grafiği, bir veri setinin teorik bir olasılık dağılımı ile karşılaştırılmasına yardımcı olan bir grafik yöntemidir. Q-Q grafiği, verilerin ne kadar iyi belirli bir olasılık dağılımına uydurulabileceğini değerlendirmek için kullanılır. Genellikle normal dağılım ile karşılaştırmak amacıyla kullanılır, ancak başka bir olasılık dağılımı da seçilebilir.
Q-Q grafiği, aşağıdaki adımlarla oluşturulur:
Verilerin Sıralanması: Veriler sıralanır, yani küçükten büyüğe veya büyükten küçüğe sıralanır.
Teorik Dağılımın Quantile Değerleri Hesaplanır: Seçilen teorik dağılım için, veri setindeki her gözleme karşılık gelen bir teorik quantile değeri hesaplanır. Bu, seçilen olasılık dağılımının "küçükten büyüğe" veya "büyükten küçüğe" sıralı veri setindeki her gözlem için ne olması gerektiğini belirler.
Q-Q Grafiği Çizilir: Bu hesaplanan teorik quantile değerleri, verilerin sırasıyla hangi pozisyonda olduğunu gösteren bir grafik çizilir. Bu grafik genellikle bir doğru veya eğri olur. Eğer veriler teorik dağılıma mükemmel bir şekilde uyar ise, bu grafik doğru bir çizgi olacaktır.
Q-Q grafiği, veri setinin normal dağılıma ne kadar uyduğunu veya başka bir teorik dağılıma ne kadar yaklaştığını görsel olarak değerlendirmek için kullanılır. Grafiğin her iki ekseni de quantile değerlerini temsil eder, ve veriler ile teorik dağılımın quantile değerleri karşılaştırılır.
Eğer Q-Q grafiği, verilerin teorik dağılıma mükemmel bir şekilde uyduğunu gösteriyorsa, grafiği bir doğru çizgi üzerinde bulursunuz. Eğer grafiği eğri bir çizgi veya eğri bir model izliyorsa, veriler teorik dağılıma tam olarak uymuyor demektir.
Q-Q grafiği, veri analizi ve özellikle normal dağılım varsayımını test etmek için istatistiksel analizlerde yaygın olarak kullanılır.
Kod:
import numpy as np import scipy.stats as stats import matplotlib.pyplot as plt # Rastgele bir veri seti oluşturma veriler = np.random.normal(loc=0, scale=1, size=1000) # Ortalaması 0, standart sapması 1 olan normal dağılım # Q-Q grafiği oluşturma stats.probplot(veriler, dist="norm", plot=plt) plt.title("Q-Q Grafiği (Normal Dağılım ile Karşılaştırma)") plt.xlabel("Teorik Quantile Değerleri") plt.ylabel("Veri Quantile Değerleri") plt.show()
Çıktı:
Bu kod, rastgele bir normal dağılıma sahip veri setini oluşturur ve bu veri setini normal dağılım ile karşılaştırmak için bir Q-Q grafiği çizer.
Grafiğin yorumlanması:
Eğer veriler mükemmel bir normal dağılıma sahipse, Q-Q grafiği bir doğru üzerinde olur.
Eğer veriler normal dağılıma tam olarak uymuyorsa, Q-Q grafiği eğri bir çizgi veya başka bir model izler.
Bu örnekte, rastgele oluşturulan veri seti normal dağılıma yakın olduğu için Q-Q grafiği bir doğru üzerindedir. Gerçek veri setlerinde, Q-Q grafiği verilerin ne kadar iyi bir teorik dağılıma uydurulduğunu değerlendirmek için kullanılır. Eğer grafiğiniz bir doğru üzerindeyse, veriler teorik dağılıma iyi uyar. Eğer eğri bir çizgi izliyorsa, veriler teorik dağılıma uymuyor olabilir.
0 Comments
Recommended Comments
There are no comments to display.