Makine öğrenmesi (Machine Learning) Terimleri
Özellik (Feature): Veri noktalarını veya örnekleri temsil eden değişkenler veya öznitelikler. Özellikler, modele girdi olarak verilir ve verinin temel özelliklerini ifade eder.
Etiket (Label): Denetimli öğrenme problemlerinde, her veri örneğinin hedef çıktısı veya sınıf etiketi. Öğrenme süreci, bu etiketleri tahmin etmeye çalışır.
Veri Kümesi (Dataset): Eğitim ve test için kullanılan örneklerin veya veri noktalarının toplamı. Veri kümesi, özellikler ve etiketlerden oluşur.
Model: Verileri analiz ederek öğrenilen ve daha sonra tahminler yapmak için kullanılan matematiksel bir algoritma veya yapı. Model, eğitim verilerini kullanarak belirli bir görevi öğrenir.
Eğitim (Training): Bir makine öğrenme modelinin veri kümesi üzerinde öğrenme süreci. Model, verileri analiz eder ve görevini öğrenir.
Test (Testing): Eğitilmiş bir modelin performansını değerlendirmek için ayrı bir veri kümesi kullanma işlemi. Test verileri, modelin gerçek dünyada ne kadar iyi çalıştığını değerlendirmeye yardımcı olur.
Denetimli Öğrenme (Supervised Learning): Modelin, veri noktaları ile eşleştirilmiş etiketleri kullanarak bir tahmin görevini öğrendiği bir öğrenme türü. Sınıflandırma ve regresyon gibi görevler için kullanılır.
Denetimsiz Öğrenme (Unsupervised Learning): Modelin veri noktalarındaki desenleri veya yapıları tanımak için etiketlenmemiş verileri kullanarak öğrenildiği bir öğrenme türü. Kümeleme ve boyut azaltma gibi görevler için kullanılır.
Çapraz Doğrulama (Cross-Validation): Modelin performansını değerlendirmek için veriyi rastgele alt veri kümelerine bölen ve her alt küme üzerinde modeli eğitip test etme işlemi. Overfitting'i önlemeye yardımcı olur.
Overfitting: Modelin eğitim verilerine aşırı uyum sağlayarak yeni verilere genelleme yapma yeteneğini kaybettiği durum. Overfitting, modelin aşırı karmaşık olduğunda veya veri miktarı az olduğunda ortaya çıkabilir.
Hiperparametre (Hyperparameter): Modelin eğitim sürecini veya yapısını kontrol eden ayarlar. Örnek olarak, öğrenme hızı, epoch sayısı ve gizli katman sayısı hiperparametreler olabilir.
Derin Öğrenme (Deep Learning): Yapay sinir ağı modelleri kullanarak büyük miktarda veriyi işlemek için kullanılan bir makine öğrenme alt dalı. Derin öğrenme, çok katmanlı ağlar kullanır.
Gradient Descent: Bir modelin kaybını minimize etmek için kullanılan bir optimizasyon algoritması. Model parametrelerini güncellerken kaybı azaltmaya çalışır.
Veri Madenciliği (Data Mining): Büyük veri kümelerinde desenler, bilgiler ve ilişkileri keşfetmek için kullanılan bir süreç. Makine öğrenmesi sıklıkla veri madenciliği süreçlerinin bir parçasıdır.
Sınıflandırma (Classification): Bir veri noktasını veya örneğini belirli bir kategoriye veya sınıfa atama işlemi. Örneğin, spam veya spam değil olarak e-postaları sınıflandırmak.
Regresyon (Regression): Bir çıktı değişkenini tahmin etmek için kullanılan bir makine öğrenme yöntemi. Genellikle sürekli değerli çıktılar için kullanılır.
Lojistik Regresyon (Logistic Regression): İkili sınıflandırma görevlerinde kullanılan bir regresyon tekniği. İkinci sınıf olasılıklarını tahmin etmek için kullanılır.
Karar Ağaçları (Decision Trees): Sınıflandırma ve regresyon görevlerini çözmek için kullanılan bir görsel modelleme tekniği. Veri kümesini ağaç yapısı şeklinde böler.
Destek Vektör Makineleri (Support Vector Machines - SVM): Sınıflandırma ve regresyon problemlerini çözmek için kullanılan bir makine öğrenme yöntemi. Sınırlayıcı hiperdüzlemi bulma esasına dayanır.
Kümeleme (Clustering): Verileri benzer gruplara veya kümeler halinde gruplandırma işlemi. K-means ve Hiyerarşik Kümeleme gibi algoritmalar kullanılır.
Boyut Azaltma (Dimensionality Reduction): Yüksek boyutlu veri kümelerini daha düşük boyutlu bir temsil haline getirme işlemi. PCA (Principal Component Analysis) bu tür bir yöntemdir.
Derin Sinir Ağı (Deep Neural Network - DNN): Birden çok katmandan oluşan yapay sinir ağı. Derin öğrenme modelinin temelini oluşturur.
Eğitim Kümesi (Training Set): Modelin eğitildiği veri kümesi. Model, bu verileri kullanarak öğrenme işlemi gerçekleştirir.
Test Kümesi (Test Set): Eğitilmiş modelin performansını değerlendirmek için kullanılan veri kümesi. Modelin gerçek dünya verileri üzerinde nasıl çalıştığını belirlemeye yardımcı olur.
Aşırı Uyum (Overfitting): Modelin eğitim verilerine aşırı derecede uyum sağlayarak yeni verilere kötü genelleme yapma eğilimi. Model, verilere çok hassas hale gelir.
Hiperdüzlem (Hyperplane): Veri noktalarını bölmek veya sınıflandırmak için kullanılan çok-boyutlu düzlem. Destek vektör makineleri bu tür hiperdüzlemleri kullanır.
Kesirli Öğrenme Oranı (Learning Rate): Gradient Descent sırasında her adımda parametrelerin ne kadar güncelleneceğini belirleyen bir hiperparametre.
Durağanlık (Convergence): Bir modelin eğitim sırasında kaybının artık azalmadığı veya değişmediği nokta. Modelin eğitimi sona erer.
Gürültü (Noise): Veri kümesinde rastgele veya anlamsız verilerin varlığı. Gürültü, modelin doğru tahminler yapmasını zorlaştırabilir.
Eğitim Verileri (Training Data): Bir makine öğrenme modelinin öğrenme sürecinde kullanılan veri örnekleri.
SVM (Support Vector Machine): Sınıflandırma ve regresyon görevleri için kullanılan bir makine öğrenme algoritması.
Bağımlı Değişken (Dependent Variable): Denetimli öğrenme problemlerinde tahmin edilmeye çalışılan değişken veya hedef.
Bağımsız Değişken (Independent Variable): Denetimli öğrenme problemlerinde bağımlı değişkeni tahmin etmekte kullanılan değişkenler.
Rastgele Orman (Random Forest): Karar ağaçlarının bir araya getirilerek oluşturulduğu bir topluluk öğrenme yöntemi.
En Yakın Komşu (k-Nearest Neighbors - k-NN): Sınıflandırma ve regresyon problemlerinde kullanılan basit bir öğrenme yöntemi. Bir veri noktasının tahminini, ona en yakın komşularının etiketlerine dayanarak yapar.
Veri Standardizasyonu (Data Standardization): Veri noktalarının ortalama değerlerini ve standart sapmalarını dikkate alarak ölçeklendirme işlemi. Veri standardizasyonu, farklı özelliklerin aynı ölçekte olmasını sağlar.
Başarım Metrikleri (Performance Metrics): Bir modelin performansını değerlendirmek için kullanılan ölçütler, örneğin doğruluk, hassasiyet, özgüllük, F1 puanı vb.
Sinir Ağı (Neural Network): Bilgisayar biliminde, yapay sinir hücresi veya nöronları taklit etmek için tasarlanmış bir matematiksel model veya hesaplama sistemi.
Aktivasyon Fonksiyonu (Activation Function): Sinir ağı katmanlarında nöronların çıkışlarını hesaplamak için kullanılan matematiksel fonksiyonlar.
Topluluk Öğrenme (Ensemble Learning): Birden fazla makine öğrenme modelini bir araya getirerek daha iyi performans elde etmeyi amaçlayan bir teknik. Örnekler arasında Bagging (örnek: Random Forest) ve Boosting (örnek: Gradient Boosting) bulunur.
Confusion Matrix (Karmaşıklık Matrisi): Sınıflandırma modelinin performansını değerlendirmek için kullanılan bir matris. Karmaşıklık matrisi, TP, TN, FP ve FN değerlerini gösterir.
Güçlü Öğrenme (Reinforcement Learning): Bir modelin çevresi ile etkileşimde bulunarak en iyi eylemi seçmesini öğrenme işlemi. Özellikle oyun teorisi ve robotikte kullanılır.
Gradient Boosting Machines (GBM): Bir topluluk öğrenme tekniği olan Gradient Boosting'in uygulandığı model ailesi.
Tahmin (Prediction): Bir modelin eğitilmiş olduğu verilere dayalı olarak gelecekteki olayları veya sonuçları tahmin etme işlemi.
Yığın Öğrenme (Batch Learning): Bir modelin belirli bir süre boyunca toplanan veri toplu olarak işlemesini ifade eder.
One-Hot Encoding: Kategorik verileri nümerik verilere dönüştürmek için kullanılan bir kodlama yöntemi. Her kategori bir nümerik vektör haline getirilir ve sadece bir eleman 1, diğerleri 0 olur.
Regularizasyon: Modelin aşırı uymasını önlemek için kullanılan bir teknik. L1 (Lasso) ve L2 (Ridge) regularizasyon örnekleridir.
Gradient Descent: Model parametrelerini optimize etmek için kullanılan bir iterasyon algoritması. Modelin kaybını azaltmaya çalışır.
Ağır Eğitim (Transfer Learning): Bir modelin bir görevdeki öğrenmelerini, başka bir görevde kullanmak için yeniden eğitme işlemi. Önceden eğitilmiş modelleri temel alır.
NLP (Natural Language Processing): İnsan dilini anlamak ve işlemek için kullanılan yapay zeka alanı. Özellikle metin verileriyle çalışır.
Derin Teşvik Öğrenme (Deep Reinforcement Learning): Derin öğrenme ve teşvik öğrenmenin birleşimi. Özellikle karmaşık karar verme problemleri için kullanılır.
Cross-Entropy Loss: Sınıflandırma problemlerinde kullanılan bir kayıp fonksiyonu. Modelin tahminlerinin doğruluğunu değerlendirir.
Epoch: Bir modelin eğitilirken tüm eğitim verilerinin tamamını bir kere işlemesini ifade eden terim. Birden çok epoch, modelin tekrar tekrar eğitilmesi anlamına gelir.
Çapraz Entropi (Cross-Entropy): İki olasılık dağılımının benzerliğini ölçen bir bilgi teorisi metriği. Özellikle sınıflandırma problemlerinde kullanılır.
Görüntü Tanıma (Image Recognition): Görüntülerdeki nesneleri veya desenleri tanımak için kullanılan makine öğrenme uygulaması.
Veri İmzalaması (Data Labeling): Denetimli öğrenme problemlerinde veri noktalarına etiket eklemek veya etiketleri düzenlemek için yapılan işlem.
Feature Extraction: Veri kümesindeki önemli özellikleri seçmek veya çıkarmak için kullanılan işlem.
PCA (Principal Component Analysis): Boyut azaltma tekniği. Veri kümesinin değişkenlik yapısını analiz eder ve önemli bileşenleri belirler.
Karmaşıklık (Complexity): Bir modelin ne kadar karmaşık olduğunu veya modelin kaç tane parametresi olduğunu ifade eden bir terim.
Birlikte Eğitim (Ensemble Learning): Birden fazla modeli bir araya getirerek daha güçlü bir model oluşturma işlemi. Örnekler arasında Bagging ve Boosting bulunur.
0 Comments
Recommended Comments
There are no comments to display.