Jump to content

Python

  • entries
    66
  • comments
    0
  • views
    992

Pandas Kütüphanesi read_csv() Fonksiyonu


Doğuhan ELMA

68 views

pandas kütüphanesinin read_csv() fonksiyonu, bir CSV (Comma-Separated Values) dosyasını okumak ve bir DataFrame nesnesine dönüştürmek için kullanılır. read_csv() fonksiyonunun bir dizi parametresi vardır, bu parametreler, veri okuma işlemi sırasında davranışınızı özelleştirmenize yardımcı olur. İşte bazı yaygın olarak kullanılan read_csv() parametrelerinin açıklamaları:

filepath_or_buffer:

Açıklama: Okunacak CSV dosyasının yolu veya URL'si. Bu parametre zorunludur.

Örnek Kullanım: filepath_or_buffer='veri.csv' veya filepath_or_buffer='https://example.com/veri.csv'.

sep (veya delimiter):

Açıklama: Sütunları ayırmak için kullanılacak ayırıcı karakteri belirtir. Varsayılan olarak virgül (,).

Örnek Kullanım: sep=';' veya delimiter='\t' (tab karakteri ile ayrılmış veriler için).

header:

Açıklama: Sütun adlarını belirlemek için kullanılacak satırın indeksi. Varsayılan olarak ilk satır (0).

Örnek Kullanım: header=0 veya header=None (sütun adları yoksa).

names:

Açıklama: Sütun adlarını belirtmek için bir liste veya dizge kullanmanıza olanak tanır. header=None kullanılıyorsa bu parametre gereklidir.

Örnek Kullanım: names=['Sütun_A', 'Sütun_B'].

index_col:

Açıklama: İndeks sütununu belirtir. Varsayılan olarak indeks yoktur.

Örnek Kullanım: index_col='ID'.

skiprows:

Açıklama: Belirli satırları okuma işlemi sırasında atlar. Özellikle başlık satırı gibi satırları atlamak için kullanışlıdır.

Örnek Kullanım: skiprows=[0, 2] (0. ve 2. satırları atlar).

nrows:

Açıklama: Okuma işlemi sırasında kaç satırın okunacağını sınırlar. Büyük verilerle çalışırken kullanışlı olabilir.

Örnek Kullanım: nrows=100.

na_values:

Açıklama: NaN (eksik) değerlerin hangi değerlerle temsil edildiğini belirtir.

Örnek Kullanım: na_values=['N/A', 'NaN'].

dtype:

Açıklama: Sütunların veri türlerini belirtir. Özellikle büyük verilerle çalışırken bellek kullanımını azaltmak için kullanışlıdır.

Örnek Kullanım: dtype={'Sütun_A': 'int32', 'Sütun_B': 'float64'}.

parse_dates:

Açıklama: Tarih ve saat sütunlarını doğrudan datetime nesnelerine dönüştürmek için kullanılır.

Örnek Kullanım: parse_dates=['Tarih_Sütunu'].

df = pd.read_csv(url, sep=',', parse_dates=['Date Collected','Date Posted'])

 

encoding:

Açıklama: Dosyanın karakter kodlamasını belirtir. Özellikle çoklu dil karakterleri içeren verilerle çalışırken önemlidir.

Örnek Kullanım: encoding='utf-8'.

Bu parametreler, read_csv() işlevini özelleştirmenize ve verilerinizi daha doğru bir şekilde işlemenize olanak tanır. Hangi parametreleri kullanmanız gerektiği, veri dosyasının yapısına ve ihtiyaçlarınıza bağlı olarak değişebilir.

0 Comments


Recommended Comments

There are no comments to display.

Guest
Add a comment...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...