Aşağıdaki sorular, temel makine öğrenimi kavramlarını daha iyi anlamanıza yardımcı olur.
Tahmine dayalı güç
Denetimli makine öğrenimi modelleri, etiketli örnekler içeren veri kümeleri kullanılarak eğitilir. Model, etiketi özelliklerden nasıl tahmin edeceğini öğrenir. Ancak veri kümesindeki her özelliğin tahmin gücü yoktur. Bazı durumlarda, etiketin öngörücüleri yalnızca birkaç özelliktir. Aşağıdaki veri kümesinde, etiket olarak fiyat ve kalan sütunları özellikler olarak kullanın.
Bir aracın fiyatını en iyi tahmin eden üç özellik hangileridir?
Make_model, year, miles.
Bir aracın markası/modeli, yılı ve kilometresi, fiyatını en iyi tahmin eden faktörler arasındadır.
Renk, yükseklik, marka_model.
Bir aracın yüksekliği ve rengi, aracın fiyatı için güçlü birer tahmin aracı değildir.
Miles, gearbox, make_model.
Şanzıman, fiyatın ana belirleyicisi değildir.
Lastik_boyutu, dingil_aralığı, yıl.
Lastik boyutu ve dingil mesafesi, bir aracın fiyatı için güçlü öngörüler değildir.
Denetimli ve denetimsiz öğrenme
Sorunun türüne bağlı olarak gözetimli veya gözetimsiz bir yaklaşım kullanırsınız.
Örneğin, tahmin etmek istediğiniz değeri veya kategoriyi önceden biliyorsanız gözetimli öğrenmeyi kullanırsınız. Ancak veri kümenizin, ilgili örneklerin segmentasyonlarını veya gruplandırmalarını içerip içermediğini öğrenmek istiyorsanız gözetimsiz öğrenmeyi kullanırsınız.
Bir online alışveriş web sitesine ait kullanıcı verilerinden oluşan bir veri kümeniz olduğunu ve bu veri kümesinin aşağıdaki sütunları içerdiğini varsayalım:
Siteyi ziyaret eden kullanıcı türlerini anlamak istiyorsanız gözetimli mi yoksa gözetimsiz mi öğrenmeyi kullanırsınız?
Gözetimli olmayan öğrenme.
Modelin, alakalı müşteri gruplarını kümelendirmesini istediğimizden denetimsiz öğrenimi kullanırız. Model kullanıcıları kümelendirdikten sonra, her küme için kendi adlarımızı oluştururuz. Örneğin, "indirim arayanlar", "fırsat arayıcıları", "göz atanlar", "sadık" ve "göz atanlar".
Kullanıcının hangi sınıfa ait olduğunu tahmin etmeye çalıştığım için denetimli öğrenme
Gözetimli öğrenmede veri kümesi, tahmin etmeye çalıştığınız etiketi içermelidir. Veri kümesinde, bir kullanıcı kategorisini belirten etiket yok.
Aşağıdaki sütunları içeren evler için bir enerji kullanımı veri kümeniz olduğunu varsayalım:
Yeni inşa edilmiş bir evde yılda kullanılan kilowatt saati tahmin etmek için ne tür bir yapay zeka kullanırsınız?
Gözetimli öğrenme.
Gözetimli öğrenme, etiketli örneklerle eğitilir. Bu veri kümesinde, modelin tahmin etmesini istediğiniz değer olduğundan "yılda kullanılan kilowatt saat" etiket olur. Özellikler şunlardır: "kare alan", "konum" ve "inşa yılı".
Gözetimli olmayan öğrenme.
Gözetimli olmayan öğrenmede etiketlenmemiş örnekler kullanılır. Bu örnekte, modelin tahmin etmesini istediğiniz değer olduğu için "yılda kullanılan kilowatt saat" etiket olur.
Aşağıdaki sütunları içeren bir uçuş veri kümeniz olduğunu varsayalım:
Bir otobüs biletinin maliyetini tahmin etmek istiyorsanız regresyon mu yoksa sınıflandırma mı kullanırsınız?
Regresyon
Regresyon modelinin çıkışı sayısal bir değerdir.
Sınıflandırma
Sınıflandırma modelinin çıkışı ayrık bir değerdir (genellikle bir kelimedir). Bu durumda, otobüs biletinin fiyatı sayısal bir değerdir.
Veri kümesine dayalı olarak, otobüs biletinin maliyetini "yüksek", "orta" veya "düşük" olarak sınıflandıracak bir sınıflandırma modeli eğitebilir misiniz?
Evet, ancak önce coach_ticket_cost
sütunundaki sayısal değerleri kategorik değerlere dönüştürmemiz gerekiyor.
Veri kümesinden sınıflandırma modeli oluşturabilirsiniz.
Aşağıdaki gibi bir işlem yapmanız gerekir:
- Kalkış havaalanından varış havaalanına giden bir biletin ortalama maliyetini bulun.
- "Yüksek", "orta" ve "düşük" değerlerini belirleyin.
- Tahmini maliyeti eşiklerle karşılaştırın ve değerin dahil olduğu kategoriyi çıkışa gönderin.
Hayır. Sınıflandırma modeli oluşturmak mümkün değildir. coach_ticket_cost
değerleri kategorik değil, sayısaldır.
Biraz çalışmayla sınıflandırma modeli oluşturabilirsiniz.
Hayır. Sınıflandırma modelleri yalnızca spam
veya not_spam
gibi iki kategoriyi tahmin eder. Bu modelin üç kategoriyi tahmin etmesi gerekir.
Sınıflandırma modelleri birden fazla kategoriyi tahmin edebilir. Bunlara çok sınıflı sınıflandırma modelleri denir.
Eğitim ve değerlendirme
Bir modeli eğittikten sonra, etiketli örnekler içeren bir veri kümesi kullanarak modelin tahmin ettiği değeri etiketin gerçek değeriyle karşılaştırarak modelin performansını değerlendiririz.
Soruya en uygun iki yanıtı seçin.
Modelin tahminleri çok uzaksa bunları iyileştirmek için ne yapabilirsiniz?
Modeli yeniden eğitin ancak yalnızca etiket için en güçlü tahmin gücüne sahip olduğunu düşündüğünüz özellikleri kullanın.
Modeli daha az sayıda ancak daha fazla tahmin gücü olan özelliklerle yeniden eğitmek, daha iyi tahminler yapan bir model oluşturabilir.
Tahminleri çok uzak olan bir modeli düzeltemezsiniz.
Tahminleri yanlış olan bir modeli düzeltmek mümkündür. Çoğu model, yararlı tahminler yapana kadar birden fazla eğitim turu gerektirir.
Daha büyük ve daha çeşitli bir veri kümesi kullanarak modeli yeniden eğitin.
Daha fazla örnek ve daha geniş bir değer aralığına sahip veri kümeleriyle eğitilen modeller, özellikler ile etiket arasındaki ilişki için daha iyi genelleştirilmiş bir çözüme sahip olduğundan daha iyi tahminler üretebilir.
Farklı bir eğitim yaklaşımı deneyin. Örneğin, gözetimli bir yaklaşım kullandıysanız gözetimsiz bir yaklaşım deneyin.
Farklı bir eğitim yaklaşımı daha iyi tahminler oluşturmaz.
Artık yapay zeka yolculuğunuzda bir sonraki adımı atmaya hazırsınız:
Kullanıcılar ve Yapay Zeka Kılavuzu. Google çalışanları, sektör uzmanları ve akademik araştırmalar tarafından sunulan bir dizi yöntem, en iyi uygulama ve örnek arıyorsanız
Sorun çerçeveleme. ML modelleri oluşturmak ve bu süreçte sık karşılaşılan hatalardan kaçınmak için saha testinden geçmiş bir yaklaşım arıyorsanız
Makine Öğrenimi Hızlandırılmış Kursu. Makine öğrenimi hakkında daha fazla bilgi edinmek için derinlemesine ve uygulamalı bir yaklaşıma hazırsanız