Jump to content
Üyelik kaydınızı yaparak son yazılan içeriklerden haberdar olun! ×

Blogs

Quantile-Quantile (Q-Q) Grafiği

Quantile-Quantile (Q-Q) grafiği, bir veri setinin teorik bir olasılık dağılımı ile karşılaştırılmasına yardımcı olan bir grafik yöntemidir. Q-Q grafiği, verilerin ne kadar iyi belirli bir olasılık dağılımına uydurulabileceğini değerlendirmek için kullanılır. Genellikle normal dağılım ile karşılaştırmak amacıyla kullanılır, ancak başka bir olasılık dağılımı da seçilebilir. Q-Q grafiği, aşağıdaki adımlarla oluşturulur: Verilerin Sıralanması: Veriler sıralanır, yani küçükten büyüğe veya b

Quantiles (Çeyrekler veya Yüzdelikler) ve Standartlaştırılmış Değişkenler (Standardized Variables veya Z-Scores)

Quantiles ve standartlaştırılmış değişkenler, veri analizinde kullanılan önemli iki kavramdır. İşte bu kavramların açıklamaları: Quantiles (Çeyrekler veya Yüzdelikler): Quantiles, bir veri setini belli yüzdelerde bölen ve verilerin sıralandığı değerlerdir. Genellikle verilerin dağılımını anlamak ve özetlemek için kullanılırlar. İlk dört temel quantile şunlardır: Alt Çeyrek (Q1 - 25. persentil): Verilerin en düşük %25'ini temsil eder. Medyan (Q2 - 50. persentil): Verileri ikiye böl

Yayılma Ölçümü (Measuring Spread)

"Measuring Spread," bir veri setinin değişkenliğini veya dağılımının ne kadar yayıldığını ölçen istatistiksel metrikleri ifade eder. Bu metrikler, verilerin dağılımının merkezi eğilim metriklerinin ötesindeki özelliklerini anlamamıza yardımcı olur. İşte spread ölçümüne yönelik temel metrikler: Varyans (Variance): Varyans, veri noktalarının ortalama etrafındaki yayılımın ölçüsüdür. Her bir veri noktasının ortalamadan ne kadar uzak olduğunu hesaplar ve bu farkların karelerinin ortalamasını al

Merkezi ölçüm (Measuring Center)

Merkezi ölçüm (Measuring Center), bir veri dağılımının merkezi konumunu tanımlamak için kullanılan istatistiksel metrikleri ifade eder. Bu metrikler, veri dağılımının hangi değerlerin veya bölgelerin etrafında yoğunlaştığını veya merkezde bulunduğunu anlamamıza yardımcı olur. İşte merkezi ölçümü ifade eden temel metrikler: Ortalama (Mean): Veri setindeki tüm değerlerin toplamının veri noktalarının sayısına bölünmesiyle hesaplanır. Ortalama, veri setinin merkezi konumunu temsil eder. Özellik

Dağılımları Sayılarla Açıklamak(Describing Distributions with Numbers)

Veri dağılımlarını tanımlamak ve özetlemek için kullanılan sayısal metrikleri ve istatistikleri içeren bir kavramdır. Bu metrikler ve istatistikler, veri setinin merkezi eğilimini, değişkenliğini ve şeklini anlamamıza yardımcı olur. İşte bu kavramın temel öğeleri: Merkezi Eğilim (Measures of Central Tendency): Ortalama (Mean): Veri setindeki tüm değerlerin toplamının veri noktalarının sayısına bölünmesiyle hesaplanır. Veri setinin merkezi konumunu temsil eder. Medyan (Median): Ver

Zaman grafiği (Time Plot)

Zaman grafiği (Time Plot), bir veri setinin zaman içindeki değişimini görsel olarak temsil eden bir grafik türüdür. Bu tür grafikler, zaman serileri olarak adlandırılan verilerin analizi için kullanılır. Zaman serileri, belirli bir süre boyunca düzenli aralıklarla ölçülen verileri içerir ve genellikle zamana bağlı değişen olayları veya süreçleri takip etmek amacıyla kullanılır. Zaman grafiklerinin temel özellikleri şunlardır: Zaman Eksen: Yatay eksende, zamanı temsil eden değerler

Scatterplot

Scatterplot, iki değişken veya özellik arasındaki ilişkiyi görsel olarak temsil eden bir grafik türüdür. Her bir veri noktası, bir eksen üzerinde bir değişkeni ve diğer eksen üzerinde diğer değişkeni temsil eder. Scatterplot, veri noktalarının dağılımını incelemek ve iki değişken arasındaki ilişkiyi anlamak için kullanılır. Scatterplot'ün temel özellikleri: Değişkenlerin İlişkisi: Scatterplot, iki değişken veya özellik arasındaki ilişkiyi görsel olarak gösterir. İki değişken arasındaki

Histogram ve Empirik Kumulatif Dağılım Fonksiyonu (ECDF)

Histogram ve Empirik Kumulatif Dağılım Fonksiyonu (ECDF), veri analizi ve görselleştirmenin iki önemli aracıdır. Her ikisi de veri setinin dağılımını incelemek ve anlamak için kullanılır. İşte bu iki kavramın açıklamaları: Histogram: Histogram, bir veri setinin dağılımını görselleştirmek için kullanılan bir grafik türüdür. Veri setindeki değerler aralıklara (genellikle çubuklar olarak adlandırılır) bölünür ve her aralıkta kaç veri noktasının bulunduğunu gösteren sütunlar çizilir. Bu sü

İki Yönlü Tablo (Two-way table)

Two-way table, verilerin iki farklı değişken veya kategori tarafından sınıflandırıldığı ve karşılaştırıldığı bir veri analizi aracıdır. İki yönlü tablo olarak da adlandırılır. Bu tablo, veri setinin iki değişkenin kesişimini ve ilişkisini gösterir. Two-way table'lar aşağıdaki temel özelliklere sahiptir: İki Değişkenin Kesişimi: Two-way table, iki farklı değişkenin (genellikle kategorik değişkenler) çapraz etkileşimini gösterir. Bu, verilerin iki farklı boyutunun birleştirilmesiyle oluş

Kategorik Verinin Gösterimi(Displaying Data)

İstatistik, verilerin toplanması, analizi, yorumlanması veya açıklanması ve sunulmasıyla ilgilenen bir matematik bilimidir. Uygun şekilde kullanılan istatistiksel ilkeler, verilerle desteklenen herhangi bir araştırmaya rehberlik etmede esastır ve özellikle veri araştırması aşamasında rutin olarak keşif ve yenilik için temel bir kaynaktır. Verilerden elde edilen bilgiler, verilerin iyi tasarlanmış bir görselleştirmesinden, modern istatistiksel öğrenme yöntemlerinden ve model seçiminin yanı sıra g

Lineer Regresyon

Lineer regresyon, bir bağımlı değişkenin (genellikle "y" olarak temsil edilir) bir veya daha fazla bağımsız değişkenle (genellikle "x" olarak temsil edilir) arasındaki ilişkiyi modellemek için kullanılan istatistiksel bir yöntemdir. Bu yöntem, değişkenler arasındaki ilişkiyi anlamamıza, gelecekteki değerleri tahmin etmemize ve verileri analiz etmemize yardımcı olur. Lineer regresyon iki ana türde gelir:   Basit Lineer Regresyon Tek bir bağımsız değişkenin (x) kullanıldığı bir

Doğuhan ELMA

Doğuhan ELMA in Nedir?

Denetimli Öğrenme - Regresyon (Regression)

Regresyon (Regression), makine öğrenme ve istatistik alanlarında kullanılan bir gözetimli öğrenme yöntemidir. Bu yöntem, bir bağımlı değişkenin (çoğunlukla sürekli bir sayısal değer) bir veya daha fazla bağımsız değişkenle nasıl ilişkilendiğini ve bu ilişkinin modelini oluşturmayı amaçlar. Regresyon, genellikle sayısal tahminler yapmak veya bağımlı değişkenin davranışını anlamak için kullanılır. İşte regresyonun temel unsurları: Bağımlı Değişken (Dependent Variable): Regresyon analizin

Doğuhan ELMA

Doğuhan ELMA in Nedir?

Denetimli Öğrenme - Sınıflandırma (Classification)

Sınıflandırma ve regresyon, makine öğrenme alanında iki temel türde gözetimli öğrenme problemini ifade eder. İşte bu iki kavramın açıklamaları: Sınıflandırma (Classification): Sınıflandırma, bir makine öğrenme modelinin bir veri noktasını bir veya daha fazla sınıfa ataması gereken bir gözetimli öğrenme türüdür. Bu tür problemlerde çıktı, genellikle sınıf etiketleri veya kategorileri içerir. Örneğin, bir e-postanın spam (istenmeyen) veya spam olmayan bir kategoriye atanması, bir gö

Doğuhan ELMA

Doğuhan ELMA in Nedir?

Eğitim Verileri (Training Data) ve Test Verileri (Testing Data) Seçimi

Eğitim Verileri (Training Data): Eğitim verileri, makine öğrenme modelinin eğitildiği ve öğrenme sürecinin gerçekleştiği veri kümesidir. Bu veri kümesi, modelin görevini anlamasına ve verilerdeki desenleri tanımasına yardımcı olur. Eğitim verileri, girdi verileri (özellikler) ile bu girdilere karşılık gelen hedef çıktılar (etiketler) içerir. Model, bu eğitim verilerini kullanarak etiketleri tahmin etmeyi öğrenir. Eğitim verilerinin kalitesi, modelin performansını önemli ölçüd

Doğuhan ELMA

Doğuhan ELMA in Nasıl Yapılır?

Makine öğrenmesi (Machine Learning) Terimleri

Özellik (Feature): Veri noktalarını veya örnekleri temsil eden değişkenler veya öznitelikler. Özellikler, modele girdi olarak verilir ve verinin temel özelliklerini ifade eder. Etiket (Label): Denetimli öğrenme problemlerinde, her veri örneğinin hedef çıktısı veya sınıf etiketi. Öğrenme süreci, bu etiketleri tahmin etmeye çalışır. Veri Kümesi (Dataset): Eğitim ve test için kullanılan örneklerin veya veri noktalarının toplamı. Veri kümesi, özellikler ve etiketlerden oluşur. Model:

Doğuhan ELMA

Doğuhan ELMA in Nedir?

Makine öğrenmesi (Machine Learning) Nedir?

Makine öğrenmesi (Machine Learning), bilgisayar sistemlerinin belirli bir görevi veya işlemi belirli bir veri ve deneyim temelinde otomatik olarak öğrenmesine ve geliştirmesine izin veren bir yapay zeka alt dalıdır. Makine öğrenmesi, karmaşık problemleri çözmek ve insan müdahalesi olmadan modelleri eğitmek için istatistik, veri madenciliği, matematik ve programlamayı bir araya getirir. İşte makine öğrenmesinin temel bileşenleri ve kavramları: Veri: Makine öğrenmesi algoritmaları, veri üzeri

Doğuhan ELMA

Doğuhan ELMA in Nedir?

wkhtmltopdf

wkhtmltopdf kütüphanesi doğrudan işletim sisteminin üzerine kurulur. wkhtmltopdf ve wkhtmltoimage, QT Webkit oluşturma motorunu kullanarak HTML'yi PDF'ye ve çeşitli görüntü formatlarına dönüştürmek için kullanılan komut satırı araçlarıdır. Bunlar tamamen "başsız" çalışır ve bir görüntüleme veya görüntüleme hizmeti gerektirmez. https://wkhtmltopdf.org/downloads.html Farklı işletim sistemleri için kurulup paketleri mevcuttur. yum localinstall <paketismi>  

Doğuhan ELMA

Doğuhan ELMA in Kütüphaneler

MySQL Nedir?

En popüler Açık Kaynak SQL veritabanı yönetim sistemi olan MySQL, Oracle Corporation tarafından geliştirilmiş, dağıtılmış ve desteklenmiştir. MySQL web sitesi (http://www.mysql.com/), MySQL yazılımı hakkında en son bilgileri sağlar. MySQL bir veritabanı yönetim sistemidir. Veritabanı yapılandırılmış bir veri topluluğudur. Basit bir alışveriş listesinden resim galerisine veya kurumsal ağdaki çok miktarda bilgiye kadar her şey olabilir. Bir bilgisayar veritabanında depolanan veriler

Doğuhan ELMA

Doğuhan ELMA in MySQL

Python Pandas DataFrame Sınıfı

Pandas DataFrame, Python'da veri analizi ve manipülasyonu için kullanılan çok güçlü bir veri yapısıdır. İşte Pandas DataFrame hakkında ayrıntılı bilgiler: 1. İki Boyutlu Veri Yapısı: DataFrame, iki boyutlu bir veri yapısıdır, yani veriyi satırlar ve sütunlar şeklinde düzenler. Bu, veriyi bir tablo veya elektronik bir çalışma sayfası gibi görselleştirmenizi sağlar. 2. Sütunlar: DataFrame'deki her sütun bir Pandas Serisi (Series) nesnesi olarak kabul edilir. Sütunlar, aynı veri tipindeki

Doğuhan ELMA

Doğuhan ELMA in Pandas

Pandas DataFrame Sütünların Veri Tiplerine Göre Filtreleme

Pandas Dataframe sütünları farklı veri tiplerinde olabilir. Değerlendirme yada topluca işlem yapmak için aynı veri tipi sütünlarını seçmek isteyebiliriz. import pandas as pd import numpy as np url = "https://raw.githubusercontent.com/TrainingByPackt/Big-Data-Analysis-with-Python/master/Lesson01/RadNet_Laboratory_Analysis.csv" df = pd.read_csv(url, sep=',') filtered_dict = {key for key, value in dict(df.dtypes).items() if value == 'object'} #int64,int32,float vb. print(df[list(filtered_dic

Pandas Kütüphanesi read_csv() Fonksiyonu

pandas kütüphanesinin read_csv() fonksiyonu, bir CSV (Comma-Separated Values) dosyasını okumak ve bir DataFrame nesnesine dönüştürmek için kullanılır. read_csv() fonksiyonunun bir dizi parametresi vardır, bu parametreler, veri okuma işlemi sırasında davranışınızı özelleştirmenize yardımcı olur. İşte bazı yaygın olarak kullanılan read_csv() parametrelerinin açıklamaları: filepath_or_buffer: Açıklama: Okunacak CSV dosyasının yolu veya URL'si. Bu parametre zorunludur. Örnek Kullanım:

Doğuhan ELMA

Doğuhan ELMA in Pandas

Python Pandas Kütüphanesi Series Sınıfı

Pandas kütüphanesindeki Series sınıfı, bir veri dizisi veya tek boyutlu bir veri yapısı oluşturmanıza olanak tanır. pandas.Series() işlevini kullanarak bir Series nesnesi oluştururken aşağıdaki ana parametreleri kullanabilirsiniz: data: Veri dizisini temsil eden bu parametre, Python listesi, numpy dizisi, başka bir Series, bir Python sözlüğü vb. olabilir. Veri, Series nesnesinin ana bileşenidir. index: Bu parametre, Series nesnesinin indekslerini tanımlar. Varsayılan olarak, bir dizi s

Doğuhan ELMA

Doğuhan ELMA in Pandas

Python Pandas Kütüphanesi

Pandas, Python programcıları için veri analizi ve manipülasyonu için kullanılan güçlü bir açık kaynak kütüphanedir. Pandas, verileri düzenlemek, temizlemek, dönüştürmek ve analiz etmek için kullanılır ve özellikle veri bilimi, veri madenciliği ve veri analizi gibi alanlarda yaygın olarak tercih edilir. Pandas, aşağıdaki iki temel veri yapısını temel alır: Pandas Serileri (Series): Tek boyutlu veri dizileridir ve her öğe bir etiket veya indeks ile ilişkilendirilir. Pandas serileri, list

Doğuhan ELMA

Doğuhan ELMA in Pandas


×
×
  • Create New...