Öğrendiklerinizi Test Etme

Aşağıdaki sorular, temel makine öğrenimi kavramlarını daha iyi anlamanıza yardımcı olur.

Tahmin gücü

Gözetimli ML modelleri, etiketli örnekler içeren veri kümeleri kullanılarak eğitilir. Model, özelliklerden etiketin nasıl tahmin edileceğini öğrenir. Ancak veri kümesindeki her özelliğin tahmin gücü yoktur. Bazı durumlarda yalnızca birkaç özellik etiketin tahmin edici işlevi görür. Aşağıdaki veri kümesinde, etiket olarak fiyatı, özellik olarak kalan sütunları kullanın.

Otomobil özelliklerine ilişkin etiketli bir örnek.

Sizce bir arabanın fiyatıyla ilgili en önemli üç özellik hangileridir?
Model_model, yıl, mil.
Bir otomobilin marka/modeli, yılı ve kilometresi büyük olasılıkla fiyatıyla ilgili en önemli göstergeler arasındadır.
Renk, yükseklik, model_model.
Otomobilin yüksekliği ve rengi, araba fiyatıyla ilgili önemli göstergeler değildir.
Mil, vites kutusu, model.
Dişli kutusu, fiyatın ana göstergesi değildir.
Lastik_boyutu, dingil_tabanı, yıl.
Lastik boyutu ve jant tabanı, bir arabanın fiyatına ilişkin önemli göstergeler değildir.

Gözetimli ve gözetimsiz öğrenim

Soruna bağlı olarak gözetimli veya denetlenmeyen bir yaklaşım tercih edersiniz. Örneğin, tahmin etmek istediğiniz değeri veya kategoriyi önceden biliyorsanız gözetimli öğrenimi kullanırsınız. Ancak, veri kümenizin herhangi bir segmentasyon veya ilgili örneklerden oluşan gruplandırmalar içerip içermediğini öğrenmek istiyorsanız gözetimsiz öğrenmeyi kullanmanız gerekir.

Bir online alışveriş web sitesi için kullanıcıların yer aldığı bir veri kümenizin olduğunu ve bu veri kümesinin aşağıdaki sütunları içerdiğini varsayalım:

Müşteri özellikleri satırının resmi.

Siteyi ziyaret eden kullanıcı türlerini anlamak isteseydiniz gözetimli mi yoksa gözetimsiz öğrenmeyi mi kullanırdınız?
Gözetimsiz öğrenme.
Modelin ilgili müşteri gruplarını kümelemesini istediğimiz için gözetimsiz öğrenmeyi kullanırız. Model, kullanıcıları kümeledikten sonra her bir küme için kendi adlarımızı oluşturuyorduk. Örneğin, "indirim arayanlar", "fırsat avcıları", "sörf avcıları", "sadık" ve "gezginler".
Gözetimli öğrenme, çünkü bir kullanıcının hangi sınıfa ait olduğunu tahmin etmeye çalışıyorum.
Gözetimli öğrenmede, veri kümesi tahmin etmeye çalıştığınız etiketi içermelidir. Veri kümesinde, bir kullanıcı kategorisini ifade eden bir etiket yoktur.

Evler için aşağıdaki sütunlara sahip bir enerji kullanımı veri kümenizin olduğunu varsayalım:

Ev özellikleri satırının resmi.

Yeni inşa edilen bir evin yıllık kilovat saatini tahmin etmek için hangi makine öğrenimi türünü kullanırsınız?
Gözetimli öğrenme.
Etiketli örnekler üzerinde gözetimli öğrenme eğitilir. Modelin tahmin etmesini istediğiniz değer bu veri kümesinde "yıllık kullanılan kilovat saat" olur. Özellikler "kare çekim", "konum" ve "inşaat yılı" olabilir.
Gözetimsiz öğrenme.
Gözetimsiz öğrenmede etiketlenmemiş örnekler kullanılır. Bu örnekte, modelin tahmin etmesini istediğiniz değer olduğu için "yıl başına kullanılan kilovat saat" etiket olur.

Aşağıdaki sütunları içeren bir uçuş veri kümenizin olduğunu varsayalım:

Uçuş verileri satırını gösteren resim.

Bir otobüs biletinin maliyetini tahmin etmek isteseydiniz regresyonu mu yoksa sınıflandırmayı mı kullanırdınız?
Regresyon
Regresyon modelinin çıkışı sayısal bir değerdir.
Sınıflandırma
Sınıflandırma modelinin çıkışı, normalde bir kelime olan ayrı bir değerdir. Bu durumda vagon bileti ücreti sayısal bir değerdir.
Veri kümesine dayanarak, bir otobüs biletinin maliyetini "yüksek", "ortalama" veya "düşük" olarak sınıflandıracak bir sınıflandırma modeli eğitebilir misiniz?
Evet, ancak öncelikle coach_ticket_cost sütunundaki sayısal değerleri kategorik değerlere dönüştürmemiz gerekiyor.
Veri kümesinden sınıflandırma modeli oluşturulabilir. Şuna benzer bir işlem yaparsınız:
  1. Kalkış havaalanından varış havaalanına giden bir biletin ortalama maliyetini bulun.
  2. "Yüksek", "ortalama" ve "düşük" olarak kabul edilecek eşikleri belirleyin.
  3. Tahmini maliyeti eşiklerle karşılaştırın ve değerin dahil olduğu kategoriyi oluşturun.
Hayır. Sınıflandırma modeli oluşturulamaz. coach_ticket_cost değerleri kategorik değil sayısaldır.
Biraz çabayla sınıflandırma modeli oluşturabilirsiniz.
Hayır. Sınıflandırma modelleri yalnızca spam veya not_spam gibi iki kategoriyi tahmin eder. Bu modelin üç kategoriyi tahmin etmesi gerekir.
Sınıflandırma modelleri birden fazla kategoriyi tahmin edebilir. Bunlara çok sınıflı sınıflandırma modelleri denir.

Eğitim ve değerlendirme

Bir modeli eğittikten sonra, etiketli örnekler içeren bir veri kümesi kullanarak modeli değerlendirir ve modelin tahmin edilen değerini etiketin gerçek değeriyle karşılaştırırız.

Soru için en uygun iki yanıtı seçin.

Modelin tahminleri çok uzaktaysa, onları daha iyi hale getirmek için ne yapabilirsiniz?
Modeli yeniden eğitin ancak yalnızca etiket için en güçlü tahmin gücüne sahip olduğunu düşündüğünüz özellikleri kullanın.
Modeli daha az özellikle yeniden eğitmek ancak tahmin etme gücü daha yüksektir. Bu sayede, daha iyi tahminlerde bulunan bir model ortaya çıkabilir.
Tahminleri çok uzak olan bir modeli düzeltemezsiniz.
Tahminleri doğru olmayan bir modeli düzeltmek mümkündür. Çoğu model, faydalı tahminler yapana kadar birkaç tur eğitim gerektirir.
Daha büyük ve daha çeşitli bir veri kümesi kullanarak modeli yeniden eğitin.
Daha fazla örnek ve daha geniş bir değer aralığı içeren veri kümelerinde eğitilen modeller, özellikler ile etiket arasındaki ilişki için modelin daha genel bir çözümü olduğundan daha iyi tahminler üretebilir.
Farklı bir eğitim yaklaşımı deneyin. Örneğin, gözetimli bir yaklaşım kullandıysanız denetlenmeyen bir yaklaşım deneyin.
Farklı bir eğitim yaklaşımı kullanmak daha iyi tahminler elde etmez.

Artık makine öğrenimi yolculuğunuzda bir sonraki adımı atmaya hazırsınız:

  • Kişiler ve Yapay Zeka Rehberi. Makine öğreniminin kullanımıyla ilgili olarak Google çalışanları, sektör uzmanları ve akademik araştırmaların sunduğu yöntemleri, en iyi uygulamaları ve örnekleri arıyorsanız.

  • Sorun Çerçeveleme. Makine öğrenimi modelleri oluşturmak ve süreçteki yaygın tehlikelerden kaçınmak için sahada test edilmiş bir yaklaşım arıyorsanız.

  • Machine Learning Crash Course (Makine Öğrenimi Hızlandırılmış Kursu). Makine öğrenimi hakkında daha fazla bilgi edinmek için ayrıntılı ve uygulamalı bir yaklaşıma hazırsanız.