Öğrendiklerinizi Test Etme

Aşağıdaki sorular, temel makine öğrenimi kavramları hakkındaki bilginizi pekiştirmenize yardımcı olur.

Tahmin gücü

Denetimli makine öğrenimi modelleri, etiketli örnekler içeren veri kümeleri kullanılarak eğitilir. Model, özelliklerden etiketi nasıl tahmin edeceğini öğrenir. Ancak bir veri kümesindeki her özelliğin tahmin gücü yoktur. Bazı durumlarda, etiketin tahmin edicisi olarak yalnızca birkaç özellik kullanılır. Aşağıdaki veri kümesinde fiyatı etiket, geri kalan sütunları ise özellik olarak kullanın.

Otomobil özelliklerinin etiketlenmiş bir örneği.

Sizce bir arabanın fiyatını en iyi tahmin edebilecek üç özellik hangileridir?
Marka_model, yıl, kilometre.
Bir arabanın markası/modeli, yılı ve kilometresi, fiyatını en iyi tahmin eden faktörler arasında yer alır.
Renk, yükseklik, marka_model.
Bir arabanın yüksekliği ve rengi, fiyatının güçlü göstergeleri değildir.
Kilometre, vites kutusu, marka_model.
Vites kutusu, fiyatın ana belirleyicisi değildir.
Tire_size, wheel_base, year.
Lastik boyutu ve dingil mesafesi, arabanın fiyatı konusunda güçlü tahminler sunmaz.

Denetimli ve denetimsiz öğrenme

Soruna bağlı olarak denetimli veya denetimsiz bir yaklaşım kullanırsınız. Örneğin, tahmin etmek istediğiniz değeri veya kategoriyi önceden biliyorsanız gözetimli öğrenmeyi kullanırsınız. Ancak veri kümenizde ilgili örneklerin herhangi bir segmentasyonu veya gruplandırması olup olmadığını öğrenmek istiyorsanız gözetimsiz öğrenmeyi kullanırsınız.

Bir online alışveriş web sitesi için kullanıcı veri kümeniz olduğunu ve bu veri kümesinde aşağıdaki sütunların bulunduğunu varsayalım:

Bir müşteri özellikleri satırının resmi.

Siteyi ziyaret eden kullanıcı türlerini anlamak istiyorsanız denetimli mi yoksa denetimsiz öğrenmeyi mi kullanırsınız?
Denetimsiz öğrenme.
Modelin, ilgili müşteri gruplarını kümelemesini istediğimiz için denetimsiz öğrenmeyi kullanırız. Model, kullanıcıları kümelendirdikten sonra her küme için kendi adlarımızı oluştururduk. Örneğin, "indirim arayanlar", "fırsat avcıları", "sörfçüler", "sadıklar" ve "gezginler".
Kullanıcının hangi sınıfa ait olduğunu tahmin etmeye çalıştığım için denetimli öğrenme.
Gözetimli öğrenmede veri kümesi, tahmin etmeye çalıştığınız etiketi içermelidir. Veri kümesinde, kullanıcı kategorisine atıfta bulunan bir etiket yok.

Aşağıdaki sütunları içeren bir enerji kullanım veri kümeniz olduğunu varsayalım:

Bir dizi ev özelliği resmi.

Yeni inşa edilmiş bir evde yıllık olarak kullanılan kilovat saatleri tahmin etmek için ne tür bir makine öğrenimi kullanırsınız?
Denetimli öğrenme.
Gözetimli öğrenme, etiketli örnekler üzerinde eğitilir. Bu veri kümesinde, modelin tahmin etmesini istediğiniz değer "yılda kullanılan kilovat saat" olduğundan bu değer etiket olarak kullanılır. Özellikler "metrekare", "konum" ve "yapım yılı" olurdu.
Denetimsiz öğrenme.
Denetimsiz öğrenmede etiketsiz örnekler kullanılır. Bu örnekte, modelin tahmin etmesini istediğiniz değer "yılda kullanılan kilovat saat" olduğundan bu değer etiket olarak kullanılır.

Aşağıdaki sütunları içeren bir uçuş veri kümeniz olduğunu varsayalım:

Bir satır uçuş verisinin resmi.

Bir uçak biletinin maliyetini tahmin etmek istiyorsanız regresyon mu yoksa sınıflandırma mı kullanırsınız?
Regresyon
Regresyon modelinin çıkışı sayısal bir değerdir.
Sınıflandırma
Bir sınıflandırma modelinin çıkışı, genellikle bir kelime olan ayrı bir değerdir. Bu durumda, uçak biletinin maliyeti sayısal bir değerdir.
Veri kümesine göre, uçak bileti maliyetini "yüksek", "ortalama" veya "düşük" olarak sınıflandıracak bir sınıflandırma modeli eğitebilir misiniz?
Evet, ancak öncelikle airplane_ticket_cost sütunundaki sayısal değerleri kategorik değerlere dönüştürmemiz gerekir.
Veri kümesinden sınıflandırma modeli oluşturmak mümkündür. Aşağıdakine benzer bir işlem yaparsınız:
  1. Kalkış havaalanından varış havaalanına biletin ortalama maliyetini bulun.
  2. "Yüksek", "ortalama" ve "düşük" olarak kabul edilecek eşikleri belirleyin.
  3. Tahmini maliyeti eşiklerle karşılaştırın ve değerin içinde bulunduğu kategoriyi çıkış olarak verin.
Hayır, sınıflandırma modeli oluşturmak mümkün değildir. airplane_ticket_cost değerleri kategorik değil, sayısal.
Biraz çalışarak sınıflandırma modeli oluşturabilirsiniz.
Hayır. Sınıflandırma modelleri yalnızca spam veya not_spam gibi iki kategori tahmin eder. Bu modelin üç kategoriyi tahmin etmesi gerekir.
Sınıflandırma modelleri birden fazla kategoriyi tahmin edebilir. Bunlara çok sınıflı sınıflandırma modelleri denir.

Eğitim ve değerlendirme

Bir modeli eğittikten sonra, etiketlenmiş örneklerin bulunduğu bir veri kümesi kullanarak modeli değerlendiririz ve modelin tahmin edilen değerini etiketin gerçek değeriyle karşılaştırırız.

Soru için en uygun iki yanıtı seçin.

Modelin tahminleri çok yanlışsa bunları iyileştirmek için ne yapabilirsiniz?
Modeli yeniden eğitin ancak yalnızca etiket için en güçlü tahmin gücüne sahip olduğuna inandığınız özellikleri kullanın.
Modeli daha az özellikle ancak daha fazla tahmin gücüyle yeniden eğitmek, daha iyi tahminler yapan bir model oluşturabilir.
Tahminleri çok yanlış olan bir modeli düzeltemezsiniz.
Tahminleri yanlış olan bir modeli düzeltmek mümkündür. Çoğu modelin faydalı tahminler yapabilmesi için birden fazla eğitim turu gerekir.
Daha büyük ve daha çeşitli bir veri kümesi kullanarak modeli yeniden eğitin.
Daha fazla örnek ve daha geniş bir değer aralığına sahip veri kümeleri üzerinde eğitilen modeller, özellikler ile etiket arasındaki ilişki için daha iyi bir genelleştirilmiş çözüme sahip olduklarından daha iyi tahminler üretebilir.
Farklı bir eğitim yaklaşımı deneyin. Örneğin, denetimli bir yaklaşım kullandıysanız denetimsiz bir yaklaşım deneyin.
Farklı bir eğitim yaklaşımı daha iyi tahminler üretmez.

Artık makine öğrenimi yolculuğunuzda bir sonraki adımı atmaya hazırsınız:

  • Makine Öğrenimi Hızlandırılmış Kursu Makine öğrenimi hakkında daha fazla bilgi edinmek için ayrıntılı ve uygulamalı bir yaklaşıma hazırsanız.

  • Sorun Çerçeveleme (Problem Framing). ML modelleri oluşturmak ve sık karşılaşılan sorunlardan kaçınmak için sahada test edilmiş bir yaklaşım arıyorsanız.

  • People + AI Guidebook (İnsanlar ve Yapay Zeka Rehberi) İnsan odaklı yapay zeka ürünleri tasarlamak için pratik rehberlik arıyorsanız.