Çerçeveleme: Önemli ML Terminolojisi

(Gözetimli) makine öğrenimi nedir? Kısa ve öz bir şekilde belirtelim:

  • ML sistemleri, daha önce hiç görülmemiş verilerle ilgili faydalı tahminler oluşturmak için girişleri nasıl birleştireceğini öğrenir.

Temel makine öğrenimi terminolojisini inceleyelim.

Etiketler

Etiket, yeniden tahmin ettiğimiz şeydir: Basit doğrusal regresyondaki y değişkeni. Etiket, buğdayın gelecekteki fiyatı, bir resimde gösterilen hayvan türü, bir ses klibinin anlamı veya hemen hemen her şey olabilir.

Özellikler

Özellik bir giriş değişkenidir: Basit doğrusal regresyondaki x değişkeni. Basit bir makine öğrenimi projesi tek bir özellik kullanabilirken daha gelişmiş bir makine öğrenimi projesi, aşağıdaki gibi milyonlarca özelliği kullanabilir:

\[\\{x_1, x_2, ... x_N\\}\]

Spam algılayıcı örneğinde aşağıdaki özellikler yer alabilir:

  • e-posta metnindeki kelimeler
  • gönderenin adresi
  • e-postanın gönderildiği saat
  • e-postada "garip bir numara" ifadesi bulunur.

Örnekler

Örnek, belirli bir veri örneğidir (x). (x işaretinin bir vektör olduğunu belirtmek için kalın harflerle yazılması gerekir.) Örnekleri iki kategoriye ayırıyoruz:

  • etiketli örnekler
  • etiketlenmemiş örnekler

Etiketli örnek, hem özellikleri hem de etiketi içerir. Yani:

  labeled examples: {features, label}: (x, y)

Modeli eğitmek için etiketlenen örnekleri kullanın. Spam algılayıcı örneğimizde, etiketli örnekler kullanıcıların açıkça "spam" veya "spam değil" olarak işaretledikleri ayrı ayrı e-postalardır.

Örneğin, aşağıdaki tabloda bir veri kümesinden Kaliforniya'daki konut fiyatlarıyla ilgili bilgiler içeren 5 etiketli örnek gösterilmektedir:

HostingMedianAge
(özellik)
totalRooms
(özellik)
toplam Yatak odası
(özellik)
medianHouseValue
(etiket)
15 5612 1283 66900
19 7650 1901 80100
17 720 174 85700
14 1501 337 73400
20 1454 326 65500

Etiketsiz örnek özellikler içerir ancak etiketi içermez. Yani:

  unlabeled examples: {features, ?}: (x, ?)

Aşağıda, aynı konut veri kümesinden medianHouseValue içeren ve etiketlenmemiş 3 örnek verilmiştir:

HostingMedianAge
(özellik)
totalRooms
(özellik)
toplam Yatak odası
(özellik)
42 1686 361
34 1226 180
33 1077 271

Modelimizi etiketli örneklerle eğittikten sonra, bu modeli etiketlenmemiş örneklerdeki etiketi tahmin etmek için kullanırız. Spam algılayıcıdaki etiketlenmemiş örnekler, insanların henüz etiketlemediği yeni e-postalardır.

Modeller

Model, özellikler ile etiket arasındaki ilişkiyi tanımlar. Örneğin, bir spam algılama modeli belirli özellikleri "spam" ile güçlü bir şekilde ilişkilendirebilir. Bir modelin hayatının iki aşamasını ele alalım:

  • Eğitim, modeli oluşturma veya öğrenme anlamına gelir. Yani modele örnek olarak model gösterilir ve model ile özellikler arasındaki ilişkileri kademeli olarak öğrenmesi sağlanır.

  • Çıkarım, eğitilmiş modeli etiketlenmemiş örneklere uygulama anlamına gelir. Yani, faydalı tahminlerde bulunmak için eğitilen modeli kullanırsınız (y'). Örneğin, çıkarım sırasında medianHouseValue etiketi kullanılmamış yeni örnekler için tahminde bulunabilirsiniz.

Regresyon ve sınıflandırma

regresyon modeli, sürekli değerleri tahmin eder. Örneğin regresyon modelleri, aşağıdaki gibi soruları cevaplayan tahminlerde bulunur:

  • Kaliforniya'daki bir evin değeri nedir?

  • Bir kullanıcının bu reklamı tıklama olasılığı nedir?

Sınıflandırma modeli, farklı değerleri tahmin eder. Örneğin, sınıflandırma modelleri aşağıdaki gibi soruları yanıtlayan tahminlerde bulunur:

  • Belirli bir e-posta iletisi spam mi yoksa spam değil mi?

  • Bu köpek, kedi veya hamster resmi mi?