Jump to content
  • entries
    7
  • comments
    0
  • views
    384

Makine öğrenmesi (Machine Learning) Terimleri


Doğuhan ELMA

56 views

Özellik (Feature): Veri noktalarını veya örnekleri temsil eden değişkenler veya öznitelikler. Özellikler, modele girdi olarak verilir ve verinin temel özelliklerini ifade eder.

Etiket (Label): Denetimli öğrenme problemlerinde, her veri örneğinin hedef çıktısı veya sınıf etiketi. Öğrenme süreci, bu etiketleri tahmin etmeye çalışır.

Veri Kümesi (Dataset): Eğitim ve test için kullanılan örneklerin veya veri noktalarının toplamı. Veri kümesi, özellikler ve etiketlerden oluşur.

Model: Verileri analiz ederek öğrenilen ve daha sonra tahminler yapmak için kullanılan matematiksel bir algoritma veya yapı. Model, eğitim verilerini kullanarak belirli bir görevi öğrenir.

Eğitim (Training): Bir makine öğrenme modelinin veri kümesi üzerinde öğrenme süreci. Model, verileri analiz eder ve görevini öğrenir.

Test (Testing): Eğitilmiş bir modelin performansını değerlendirmek için ayrı bir veri kümesi kullanma işlemi. Test verileri, modelin gerçek dünyada ne kadar iyi çalıştığını değerlendirmeye yardımcı olur.

Denetimli Öğrenme (Supervised Learning): Modelin, veri noktaları ile eşleştirilmiş etiketleri kullanarak bir tahmin görevini öğrendiği bir öğrenme türü. Sınıflandırma ve regresyon gibi görevler için kullanılır.

Denetimsiz Öğrenme (Unsupervised Learning): Modelin veri noktalarındaki desenleri veya yapıları tanımak için etiketlenmemiş verileri kullanarak öğrenildiği bir öğrenme türü. Kümeleme ve boyut azaltma gibi görevler için kullanılır.

Çapraz Doğrulama (Cross-Validation): Modelin performansını değerlendirmek için veriyi rastgele alt veri kümelerine bölen ve her alt küme üzerinde modeli eğitip test etme işlemi. Overfitting'i önlemeye yardımcı olur.

Overfitting: Modelin eğitim verilerine aşırı uyum sağlayarak yeni verilere genelleme yapma yeteneğini kaybettiği durum. Overfitting, modelin aşırı karmaşık olduğunda veya veri miktarı az olduğunda ortaya çıkabilir.

Hiperparametre (Hyperparameter): Modelin eğitim sürecini veya yapısını kontrol eden ayarlar. Örnek olarak, öğrenme hızı, epoch sayısı ve gizli katman sayısı hiperparametreler olabilir.

Derin Öğrenme (Deep Learning): Yapay sinir ağı modelleri kullanarak büyük miktarda veriyi işlemek için kullanılan bir makine öğrenme alt dalı. Derin öğrenme, çok katmanlı ağlar kullanır.

Gradient Descent: Bir modelin kaybını minimize etmek için kullanılan bir optimizasyon algoritması. Model parametrelerini güncellerken kaybı azaltmaya çalışır.

Veri Madenciliği (Data Mining): Büyük veri kümelerinde desenler, bilgiler ve ilişkileri keşfetmek için kullanılan bir süreç. Makine öğrenmesi sıklıkla veri madenciliği süreçlerinin bir parçasıdır.

Sınıflandırma (Classification): Bir veri noktasını veya örneğini belirli bir kategoriye veya sınıfa atama işlemi. Örneğin, spam veya spam değil olarak e-postaları sınıflandırmak.

Regresyon (Regression): Bir çıktı değişkenini tahmin etmek için kullanılan bir makine öğrenme yöntemi. Genellikle sürekli değerli çıktılar için kullanılır.

Lojistik Regresyon (Logistic Regression): İkili sınıflandırma görevlerinde kullanılan bir regresyon tekniği. İkinci sınıf olasılıklarını tahmin etmek için kullanılır.

Karar Ağaçları (Decision Trees): Sınıflandırma ve regresyon görevlerini çözmek için kullanılan bir görsel modelleme tekniği. Veri kümesini ağaç yapısı şeklinde böler.

Destek Vektör Makineleri (Support Vector Machines - SVM): Sınıflandırma ve regresyon problemlerini çözmek için kullanılan bir makine öğrenme yöntemi. Sınırlayıcı hiperdüzlemi bulma esasına dayanır.

Kümeleme (Clustering): Verileri benzer gruplara veya kümeler halinde gruplandırma işlemi. K-means ve Hiyerarşik Kümeleme gibi algoritmalar kullanılır.

Boyut Azaltma (Dimensionality Reduction): Yüksek boyutlu veri kümelerini daha düşük boyutlu bir temsil haline getirme işlemi. PCA (Principal Component Analysis) bu tür bir yöntemdir.

Derin Sinir Ağı (Deep Neural Network - DNN): Birden çok katmandan oluşan yapay sinir ağı. Derin öğrenme modelinin temelini oluşturur.

Eğitim Kümesi (Training Set): Modelin eğitildiği veri kümesi. Model, bu verileri kullanarak öğrenme işlemi gerçekleştirir.

Test Kümesi (Test Set): Eğitilmiş modelin performansını değerlendirmek için kullanılan veri kümesi. Modelin gerçek dünya verileri üzerinde nasıl çalıştığını belirlemeye yardımcı olur.

Aşırı Uyum (Overfitting): Modelin eğitim verilerine aşırı derecede uyum sağlayarak yeni verilere kötü genelleme yapma eğilimi. Model, verilere çok hassas hale gelir.

Hiperdüzlem (Hyperplane): Veri noktalarını bölmek veya sınıflandırmak için kullanılan çok-boyutlu düzlem. Destek vektör makineleri bu tür hiperdüzlemleri kullanır.

Kesirli Öğrenme Oranı (Learning Rate): Gradient Descent sırasında her adımda parametrelerin ne kadar güncelleneceğini belirleyen bir hiperparametre.

Durağanlık (Convergence): Bir modelin eğitim sırasında kaybının artık azalmadığı veya değişmediği nokta. Modelin eğitimi sona erer.

Gürültü (Noise): Veri kümesinde rastgele veya anlamsız verilerin varlığı. Gürültü, modelin doğru tahminler yapmasını zorlaştırabilir.

Eğitim Verileri (Training Data): Bir makine öğrenme modelinin öğrenme sürecinde kullanılan veri örnekleri.

SVM (Support Vector Machine): Sınıflandırma ve regresyon görevleri için kullanılan bir makine öğrenme algoritması.

Bağımlı Değişken (Dependent Variable): Denetimli öğrenme problemlerinde tahmin edilmeye çalışılan değişken veya hedef.

Bağımsız Değişken (Independent Variable): Denetimli öğrenme problemlerinde bağımlı değişkeni tahmin etmekte kullanılan değişkenler.

Rastgele Orman (Random Forest): Karar ağaçlarının bir araya getirilerek oluşturulduğu bir topluluk öğrenme yöntemi.

En Yakın Komşu (k-Nearest Neighbors - k-NN): Sınıflandırma ve regresyon problemlerinde kullanılan basit bir öğrenme yöntemi. Bir veri noktasının tahminini, ona en yakın komşularının etiketlerine dayanarak yapar.

Veri Standardizasyonu (Data Standardization): Veri noktalarının ortalama değerlerini ve standart sapmalarını dikkate alarak ölçeklendirme işlemi. Veri standardizasyonu, farklı özelliklerin aynı ölçekte olmasını sağlar.

Başarım Metrikleri (Performance Metrics): Bir modelin performansını değerlendirmek için kullanılan ölçütler, örneğin doğruluk, hassasiyet, özgüllük, F1 puanı vb.

Sinir Ağı (Neural Network): Bilgisayar biliminde, yapay sinir hücresi veya nöronları taklit etmek için tasarlanmış bir matematiksel model veya hesaplama sistemi.

Aktivasyon Fonksiyonu (Activation Function): Sinir ağı katmanlarında nöronların çıkışlarını hesaplamak için kullanılan matematiksel fonksiyonlar.

Topluluk Öğrenme (Ensemble Learning): Birden fazla makine öğrenme modelini bir araya getirerek daha iyi performans elde etmeyi amaçlayan bir teknik. Örnekler arasında Bagging (örnek: Random Forest) ve Boosting (örnek: Gradient Boosting) bulunur.

Confusion Matrix (Karmaşıklık Matrisi): Sınıflandırma modelinin performansını değerlendirmek için kullanılan bir matris. Karmaşıklık matrisi, TP, TN, FP ve FN değerlerini gösterir.

Güçlü Öğrenme (Reinforcement Learning): Bir modelin çevresi ile etkileşimde bulunarak en iyi eylemi seçmesini öğrenme işlemi. Özellikle oyun teorisi ve robotikte kullanılır.

Gradient Boosting Machines (GBM): Bir topluluk öğrenme tekniği olan Gradient Boosting'in uygulandığı model ailesi.

Tahmin (Prediction): Bir modelin eğitilmiş olduğu verilere dayalı olarak gelecekteki olayları veya sonuçları tahmin etme işlemi.

Yığın Öğrenme (Batch Learning): Bir modelin belirli bir süre boyunca toplanan veri toplu olarak işlemesini ifade eder.

One-Hot Encoding: Kategorik verileri nümerik verilere dönüştürmek için kullanılan bir kodlama yöntemi. Her kategori bir nümerik vektör haline getirilir ve sadece bir eleman 1, diğerleri 0 olur.

Regularizasyon: Modelin aşırı uymasını önlemek için kullanılan bir teknik. L1 (Lasso) ve L2 (Ridge) regularizasyon örnekleridir.

Gradient Descent: Model parametrelerini optimize etmek için kullanılan bir iterasyon algoritması. Modelin kaybını azaltmaya çalışır.

Ağır Eğitim (Transfer Learning): Bir modelin bir görevdeki öğrenmelerini, başka bir görevde kullanmak için yeniden eğitme işlemi. Önceden eğitilmiş modelleri temel alır.

NLP (Natural Language Processing): İnsan dilini anlamak ve işlemek için kullanılan yapay zeka alanı. Özellikle metin verileriyle çalışır.

Derin Teşvik Öğrenme (Deep Reinforcement Learning): Derin öğrenme ve teşvik öğrenmenin birleşimi. Özellikle karmaşık karar verme problemleri için kullanılır.

Cross-Entropy Loss: Sınıflandırma problemlerinde kullanılan bir kayıp fonksiyonu. Modelin tahminlerinin doğruluğunu değerlendirir.

Epoch: Bir modelin eğitilirken tüm eğitim verilerinin tamamını bir kere işlemesini ifade eden terim. Birden çok epoch, modelin tekrar tekrar eğitilmesi anlamına gelir.

Çapraz Entropi (Cross-Entropy): İki olasılık dağılımının benzerliğini ölçen bir bilgi teorisi metriği. Özellikle sınıflandırma problemlerinde kullanılır.

Görüntü Tanıma (Image Recognition): Görüntülerdeki nesneleri veya desenleri tanımak için kullanılan makine öğrenme uygulaması.

Veri İmzalaması (Data Labeling): Denetimli öğrenme problemlerinde veri noktalarına etiket eklemek veya etiketleri düzenlemek için yapılan işlem.

Feature Extraction: Veri kümesindeki önemli özellikleri seçmek veya çıkarmak için kullanılan işlem.

PCA (Principal Component Analysis): Boyut azaltma tekniği. Veri kümesinin değişkenlik yapısını analiz eder ve önemli bileşenleri belirler.

Karmaşıklık (Complexity): Bir modelin ne kadar karmaşık olduğunu veya modelin kaç tane parametresi olduğunu ifade eden bir terim.

Birlikte Eğitim (Ensemble Learning): Birden fazla modeli bir araya getirerek daha güçlü bir model oluşturma işlemi. Örnekler arasında Bagging ve Boosting bulunur.

0 Comments


Recommended Comments

There are no comments to display.

Guest
Add a comment...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...