(Gözetimli) makine öğrenimi nedir? Kısa ve öz bir şekilde belirtelim:
- ML sistemleri, daha önce hiç görülmemiş verilerle ilgili faydalı tahminler oluşturmak için girişleri nasıl birleştireceğini öğrenir.
Temel makine öğrenimi terminolojisini inceleyelim.
Etiketler
Etiket, yeniden tahmin ettiğimiz şeydir: Basit doğrusal regresyondaki y
değişkeni. Etiket, buğdayın gelecekteki fiyatı, bir resimde gösterilen hayvan türü, bir ses klibinin anlamı veya hemen hemen her şey olabilir.
Özellikler
Özellik bir giriş değişkenidir: Basit doğrusal regresyondaki x
değişkeni. Basit bir makine öğrenimi projesi tek bir özellik kullanabilirken daha gelişmiş bir makine öğrenimi projesi, aşağıdaki gibi milyonlarca özelliği kullanabilir:
\[\\{x_1, x_2, ... x_N\\}\]
Spam algılayıcı örneğinde aşağıdaki özellikler yer alabilir:
- e-posta metnindeki kelimeler
- gönderenin adresi
- e-postanın gönderildiği saat
- e-postada "garip bir numara" ifadesi bulunur.
Örnekler
Örnek, belirli bir veri örneğidir (x). (x işaretinin bir vektör olduğunu belirtmek için kalın harflerle yazılması gerekir.) Örnekleri iki kategoriye ayırıyoruz:
- etiketli örnekler
- etiketlenmemiş örnekler
Etiketli örnek, hem özellikleri hem de etiketi içerir. Yani:
labeled examples: {features, label}: (x, y)
Modeli eğitmek için etiketlenen örnekleri kullanın. Spam algılayıcı örneğimizde, etiketli örnekler kullanıcıların açıkça "spam" veya "spam değil" olarak işaretledikleri ayrı ayrı e-postalardır.
Örneğin, aşağıdaki tabloda bir veri kümesinden Kaliforniya'daki konut fiyatlarıyla ilgili bilgiler içeren 5 etiketli örnek gösterilmektedir:
HostingMedianAge (özellik) |
totalRooms (özellik) |
toplam Yatak odası (özellik) |
medianHouseValue (etiket) |
---|---|---|---|
15 | 5612 | 1283 | 66900 |
19 | 7650 | 1901 | 80100 |
17 | 720 | 174 | 85700 |
14 | 1501 | 337 | 73400 |
20 | 1454 | 326 | 65500 |
Etiketsiz örnek özellikler içerir ancak etiketi içermez. Yani:
unlabeled examples: {features, ?}: (x, ?)
Aşağıda, aynı konut veri kümesinden medianHouseValue
içeren ve etiketlenmemiş 3 örnek verilmiştir:
HostingMedianAge (özellik) |
totalRooms (özellik) |
toplam Yatak odası (özellik) |
---|---|---|
42 | 1686 | 361 |
34 | 1226 | 180 |
33 | 1077 | 271 |
Modelimizi etiketli örneklerle eğittikten sonra, bu modeli etiketlenmemiş örneklerdeki etiketi tahmin etmek için kullanırız. Spam algılayıcıdaki etiketlenmemiş örnekler, insanların henüz etiketlemediği yeni e-postalardır.
Modeller
Model, özellikler ile etiket arasındaki ilişkiyi tanımlar. Örneğin, bir spam algılama modeli belirli özellikleri "spam" ile güçlü bir şekilde ilişkilendirebilir. Bir modelin hayatının iki aşamasını ele alalım:
Eğitim, modeli oluşturma veya öğrenme anlamına gelir. Yani modele örnek olarak model gösterilir ve model ile özellikler arasındaki ilişkileri kademeli olarak öğrenmesi sağlanır.
Çıkarım, eğitilmiş modeli etiketlenmemiş örneklere uygulama anlamına gelir. Yani, faydalı tahminlerde bulunmak için eğitilen modeli kullanırsınız (
y'
). Örneğin, çıkarım sırasındamedianHouseValue
etiketi kullanılmamış yeni örnekler için tahminde bulunabilirsiniz.
Regresyon ve sınıflandırma
regresyon modeli, sürekli değerleri tahmin eder. Örneğin regresyon modelleri, aşağıdaki gibi soruları cevaplayan tahminlerde bulunur:
Kaliforniya'daki bir evin değeri nedir?
Bir kullanıcının bu reklamı tıklama olasılığı nedir?
Sınıflandırma modeli, farklı değerleri tahmin eder. Örneğin, sınıflandırma modelleri aşağıdaki gibi soruları yanıtlayan tahminlerde bulunur:
Belirli bir e-posta iletisi spam mi yoksa spam değil mi?
Bu köpek, kedi veya hamster resmi mi?