pandas kütüphanesinin read_csv() fonksiyonu, bir CSV (Comma-Separated Values) dosyasını okumak ve bir DataFrame nesnesine dönüştürmek için kullanılır. read_csv() fonksiyonunun bir dizi parametresi vardır, bu parametreler, veri okuma işlemi sırasında davranışınızı özelleştirmenize yardımcı olur. İşte bazı yaygın olarak kullanılan read_csv() parametrelerinin açıklamaları:
filepath_or_buffer:
Açıklama: Okunacak CSV dosyasının yolu veya URL'si. Bu parametre zorunludur.
Örnek Kullanım: filepath_or_buffer='veri.csv' veya filepath_or_buffer='https://example.com/veri.csv'.
sep (veya delimiter):
Açıklama: Sütunları ayırmak için kullanılacak ayırıcı karakteri belirtir. Varsayılan olarak virgül (,).
Örnek Kullanım: sep=';' veya delimiter='\t' (tab karakteri ile ayrılmış veriler için).
header:
Açıklama: Sütun adlarını belirlemek için kullanılacak satırın indeksi. Varsayılan olarak ilk satır (0).
Örnek Kullanım: header=0 veya header=None (sütun adları yoksa).
names:
Açıklama: Sütun adlarını belirtmek için bir liste veya dizge kullanmanıza olanak tanır. header=None kullanılıyorsa bu parametre gereklidir.
Örnek Kullanım: names=['Sütun_A', 'Sütun_B'].
index_col:
Açıklama: İndeks sütununu belirtir. Varsayılan olarak indeks yoktur.
Örnek Kullanım: index_col='ID'.
skiprows:
Açıklama: Belirli satırları okuma işlemi sırasında atlar. Özellikle başlık satırı gibi satırları atlamak için kullanışlıdır.
Örnek Kullanım: skiprows=[0, 2] (0. ve 2. satırları atlar).
nrows:
Açıklama: Okuma işlemi sırasında kaç satırın okunacağını sınırlar. Büyük verilerle çalışırken kullanışlı olabilir.
Örnek Kullanım: nrows=100.
na_values:
Açıklama: NaN (eksik) değerlerin hangi değerlerle temsil edildiğini belirtir.
Örnek Kullanım: na_values=['N/A', 'NaN'].
dtype:
Açıklama: Sütunların veri türlerini belirtir. Özellikle büyük verilerle çalışırken bellek kullanımını azaltmak için kullanışlıdır.
Örnek Kullanım: dtype={'Sütun_A': 'int32', 'Sütun_B': 'float64'}.
parse_dates:
Açıklama: Tarih ve saat sütunlarını doğrudan datetime nesnelerine dönüştürmek için kullanılır.
Örnek Kullanım: parse_dates=['Tarih_Sütunu'].
df = pd.read_csv(url, sep=',', parse_dates=['Date Collected','Date Posted'])
encoding:
Açıklama: Dosyanın karakter kodlamasını belirtir. Özellikle çoklu dil karakterleri içeren verilerle çalışırken önemlidir.
Örnek Kullanım: encoding='utf-8'.
Bu parametreler, read_csv() işlevini özelleştirmenize ve verilerinizi daha doğru bir şekilde işlemenize olanak tanır. Hangi parametreleri kullanmanız gerektiği, veri dosyasının yapısına ve ihtiyaçlarınıza bağlı olarak değişebilir.
0 Comments
Recommended Comments
There are no comments to display.