Aşağıdaki sorular, temel makine öğrenimi kavramlarını daha iyi anlamanıza yardımcı olur.
Tahmine dayalı güç
Denetimli makine öğrenimi modelleri, etiketli örnekler içeren veri kümeleri kullanılarak eğitilir. Model, etiketi özelliklerden nasıl tahmin edeceğini öğrenir. Ancak veri kümesindeki her özelliğin tahmin gücü yoktur. Bazı durumlarda, etiketin öngörücüleri yalnızca birkaç özelliktir. Aşağıdaki veri kümesinde, etiket olarak fiyat ve kalan sütunları özellikler olarak kullanın.
Bir aracın fiyatını en iyi tahmin eden üç özellik hangileridir?
Miles, gearbox, make_model.
Şanzıman, fiyatın ana belirleyicisi değildir.
Lastik_boyutu, dingil_aralığı, yıl.
Lastik boyutu ve dingil mesafesi, bir aracın fiyatını tahmin etmek için güçlü öngörüler değildir.
Make_model, year, miles.
Bir aracın markası/modeli, yılı ve kilometresi, fiyatını en iyi tahmin eden faktörler arasındadır.
Renk, yükseklik, marka_model.
Bir aracın yüksekliği ve rengi, aracın fiyatı için güçlü birer tahmin aracı değildir.
Denetimli ve denetimsiz öğrenme
Sorunun türüne bağlı olarak gözetimli veya gözetimsiz bir yaklaşım kullanırsınız.
Örneğin, tahmin etmek istediğiniz değeri veya kategoriyi önceden biliyorsanız gözetimli öğrenmeyi kullanırsınız. Ancak veri kümenizin, ilgili örneklerin segmentasyonlarını veya gruplandırmalarını içerip içermediğini öğrenmek istiyorsanız gözetimsiz öğrenmeyi kullanırsınız.
Bir online alışveriş web sitesine ait kullanıcı verilerinden oluşan bir veri kümeniz olduğunu ve bu veri kümesinin aşağıdaki sütunları içerdiğini varsayalım:
Siteyi ziyaret eden kullanıcı türlerini anlamak istiyorsanız gözetimli mi yoksa gözetimsiz mi öğrenmeyi kullanırsınız?
Kullanıcının hangi sınıfa ait olduğunu tahmin etmeye çalıştığım için denetimli öğrenme
Gözetimli öğrenmede veri kümesi, tahmin etmeye çalıştığınız etiketi içermelidir. Veri kümesinde, bir kullanıcı kategorisini belirten bir etiket yok.
Gözetimli olmayan öğrenme.
Modelin, alakalı müşteri gruplarını kümelendirmesini istediğimizden denetimsiz öğrenimi kullanırız. Model kullanıcıları kümeledikten sonra, her küme için kendi adlarımızı oluştururuz. Örneğin, "indirim arayanlar", "fırsat arayıcıları", "göz atanlar", "sadık" ve "göz atanlar".
Aşağıdaki sütunları içeren evler için bir enerji kullanımı veri kümeniz olduğunu varsayalım:
Yeni inşa edilmiş bir evde yılda kullanılan kilowatt saat sayısını tahmin etmek için ne tür bir yapay zeka kullanırsınız?
Gözetimli öğrenme.
Gözetimli öğrenme, etiketli örneklerle eğitilir. Bu veri kümesinde, modelin tahmin etmesini istediğiniz değer "yılda kullanılan kilowatt saat" olduğundan etiket bu olur. Özellikler şunlardır: "kare alan", "konum" ve "inşa yılı".
Gözetimli olmayan öğrenme.
Gözetimli olmayan öğrenmede etiketlenmemiş örnekler kullanılır. Bu örnekte, modelin tahmin etmesini istediğiniz değer olduğu için "yılda kullanılan kilowatt saat" etiket olur.
Aşağıdaki sütunları içeren bir uçuş veri kümeniz olduğunu varsayalım:
Bir otobüs biletinin maliyetini tahmin etmek istiyorsanız regresyon mu yoksa sınıflandırma mı kullanırsınız?
Regresyon
Regresyon modelinin çıkışı sayısal bir değerdir.
Sınıflandırma
Sınıflandırma modelinin çıkışı ayrık bir değerdir (genellikle bir kelimedir). Bu durumda, otobüs biletinin fiyatı sayısal bir değerdir.
Veri kümesine dayalı olarak, otobüs biletinin maliyetini "yüksek", "orta" veya "düşük" olarak sınıflandıracak bir sınıflandırma modeli eğitebilir misiniz?
Hayır. Sınıflandırma modelleri yalnızca spam
veya not_spam
gibi iki kategoriyi tahmin eder. Bu modelin üç kategoriyi tahmin etmesi gerekir.
Sınıflandırma modelleri birden fazla kategoriyi tahmin edebilir. Bunlara çok sınıflı sınıflandırma modelleri denir.
Hayır. Sınıflandırma modeli oluşturmak mümkün değildir. coach_ticket_cost
değerleri kategorik değil, sayısaldır.
Biraz çalışmayla sınıflandırma modeli oluşturabilirsiniz.
Evet, ancak önce coach_ticket_cost
sütunundaki sayısal değerleri kategorik değerlere dönüştürmemiz gerekiyor.
Veri kümesinden sınıflandırma modeli oluşturabilirsiniz.
Aşağıdaki gibi bir işlem yapmanız gerekir:
- Kalkış havaalanından varış havaalanına giden bir biletin ortalama maliyetini bulun.
- "Yüksek", "orta" ve "düşük" değerlerini belirleyin.
- Tahmini maliyeti eşiklerle karşılaştırın ve değerin dahil olduğu kategoriyi döndürün.
Eğitim ve değerlendirme
Bir modeli eğittikten sonra, etiketli örnekler içeren bir veri kümesi kullanarak modelin tahmin ettiği değeri etiketin gerçek değeriyle karşılaştırarak modelin performansını değerlendiririz.
Soruya en uygun iki yanıtı seçin.
Modelin tahminleri çok uzaksa bunları iyileştirmek için ne yapabilirsiniz?
Farklı bir eğitim yaklaşımı deneyin. Örneğin, gözetimli bir yaklaşım kullandıysanız gözetimsiz bir yaklaşım deneyin.
Farklı bir eğitim yaklaşımı daha iyi tahminler oluşturmaz.
Modeli yeniden eğitin ancak yalnızca etiket için en güçlü tahmin gücüne sahip olduğunu düşündüğünüz özellikleri kullanın.
Modeli daha az sayıda ancak daha fazla tahmin gücü olan özelliklerle yeniden eğitmek, daha iyi tahminler yapan bir model oluşturabilir.
Daha büyük ve daha çeşitli bir veri kümesi kullanarak modeli yeniden eğitin.
Daha fazla örnek ve daha geniş bir değer aralığına sahip veri kümeleriyle eğitilen modeller, özellikler ile etiket arasındaki ilişki için daha iyi genelleştirilmiş bir çözüme sahip olduğundan daha iyi tahminler üretebilir.
Tahminleri çok uzak olan bir modeli düzeltemezsiniz.
Tahminleri yanlış olan bir modeli düzeltmek mümkündür. Çoğu model, yararlı tahminler yapana kadar birden fazla eğitim turu gerektirir.
Artık yapay zeka yolculuğunuzda bir sonraki adımı atmaya hazırsınız:
Kullanıcılar ve Yapay Zeka Kılavuzu. Google çalışanları, sektör uzmanları ve akademik araştırmalar tarafından sunulan bir dizi yöntem, en iyi uygulama ve örnek arıyorsanız
Sorun Çerçeveleme. ML modelleri oluşturmak ve bu süreçte sık karşılaşılan hatalardan kaçınmak için saha testlerinde onaylanmış bir yaklaşım arıyorsanız
Makine Öğrenimi Hızlandırılmış Kursu. Makine öğrenimi hakkında daha fazla bilgi edinmek için derinlemesine ve uygulamalı bir yaklaşıma hazırsanız