Bu sayfa, Cloud Translation API ile çevrilmiştir.

Makine Öğrenimi Sözlüğü: Makine Öğrenimiyle İlgili Temel Bilgiler

Bu sayfada, makine öğreniminin temelleriyle ilgili terimlerin yer aldığı bir sözlük bulunmaktadır. Tüm sözlük terimleri için burayı tıklayın.

A

doğruluk

#fundamentals

#Metric

Doğru sınıflandırma tahminlerinin sayısının toplam tahmin sayısına bölünmesiyle elde edilir. Yani:

$$\text{Accuracy} = \frac{\text{correct predictions}} {\text{correct predictions + incorrect predictions }}$$

Örneğin, 40 doğru ve 10 yanlış tahminde bulunan bir modelin doğruluğu şu şekilde olur:

$$\text{Accuracy} = \frac{\text{40}} {\text{40 + 10}} = \text{80%}$$

İkili sınıflandırma, doğru tahminler ve yanlış tahminler kategorileri için belirli adlar sağlar. Bu nedenle, ikili sınıflandırma için doğruluk formülü aşağıdaki gibidir:

$$\text{Accuracy} = \frac{\text{TP} + \text{TN}} {\text{TP} + \text{TN} + \text{FP} + \text{FN}}$$

Bu örnekte:

TP, doğru pozitif (doğru tahminler) sayısıdır.
TN, doğru negatiflerin (doğru tahminler) sayısıdır.
FP, yanlış pozitiflerin (yanlış tahminler) sayısıdır.
FN, yanlış negatiflerin (yanlış tahminler) sayısıdır.

Doğruluğu hassasiyet ve geri çağırma ile karşılaştırın.

Doğruluk ve sınıf dengesizliği olan veri kümeleri hakkında ayrıntılı bilgi için simgeyi tıklayın.

Doğruluk, bazı durumlarda değerli bir metrik olsa da diğer durumlarda oldukça yanıltıcıdır. Doğruluk, özellikle sınıf dengesizliği olan veri kümelerini işleyen sınıflandırma modellerini değerlendirmek için genellikle uygun bir metrik değildir.

Örneğin, belirli bir subtropikal şehirde yüzyılda yalnızca 25 gün kar yağdığını varsayalım. Kar yağmayan günlerin (negatif sınıf) sayısı, kar yağdığı günlerin (pozitif sınıf) sayısından çok daha fazla olduğundan, bu şehir için kar veri kümesi sınıf dengesizliğine sahiptir. Her gün kar yağacak mı yoksa yağmayacak mı tahmininde bulunması gereken bir ikili sınıflandırma modelinin her gün "kar yağmayacak" tahmininde bulunduğunu düşünün. Bu model oldukça doğru ancak tahmin gücü yok. Aşağıdaki tabloda, bir asırlık tahminlerin sonuçları özetlenmektedir:

Kategori	Sayı
TP	0
TN	36499
FP	0
FN	25

Bu nedenle, modelin doğruluğu şöyledir:

accuracy = (TP + TN) / (TP + TN + FP + FN)
accuracy = (0 + 36499) / (0 + 36499 + 0 + 25) = 0.9993 = 99.93%

%99, 93 doğruluk oranı çok etkileyici görünse de modelin aslında tahmin gücü yoktur.

Sınıf dengesizliği olan veri kümeleri üzerinde eğitilmiş modelleri değerlendirirken hassasiyet ve geri çağırma genellikle doğruluktan daha kullanışlı metriklerdir.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sınıflandırma: Doğruluk, geri çağırma, hassasiyet ve ilgili metrikler bölümüne bakın.

etkinleştirme işlevi

#fundamentals

Nöral ağların özellikler ile etiket arasındaki doğrusal olmayan (karmaşık) ilişkileri öğrenmesini sağlayan bir işlev.

Popüler etkinleştirme işlevleri şunlardır:

ReLU
Sigmoid

Etkinleştirme fonksiyonlarının grafikleri hiçbir zaman tek bir düz çizgi değildir. Örneğin, ReLU etkinleştirme işlevinin grafiği iki düz çizgiden oluşur:

İki çizgili bir kartezyen grafik. İlk satırın sabit bir y değeri vardır. Bu değer 0'dır ve x ekseni boyunca -sonsuz,0 ile 0,-0 arasında değişir.
İkinci satır 0,0'dan başlar. Bu doğrunun eğimi +1 olduğundan 0,0 noktasından +sonsuz,+sonsuz noktasına kadar uzanır.

Sigmoid aktivasyon fonksiyonunun grafiği şu şekilde görünür:

X değerlerinin -sonsuz ile +pozitif arasında, y değerlerinin ise neredeyse 0 ile neredeyse 1 arasında değiştiği iki boyutlu eğri grafik. x 0 olduğunda y 0, 5 olur. Eğrinin eğimi her zaman pozitiftir.En yüksek eğim 0,05'te olup x'in mutlak değeri arttıkça eğimler kademeli olarak azalır.

Örnek görmek için simgeyi tıklayın.

Nöral ağlarda etkinleştirme işlevleri, bir nörona gelen tüm girişlerin ağırlıklı toplamını değiştirir. Nöron, ağırlıklı toplamı hesaplamak için ilgili değerlerin ve ağırlıkların çarpımlarını toplar. Örneğin, bir nöronla ilgili girişin aşağıdakilerden oluştuğunu varsayalım:

giriş değeri	giriş ağırlığı
2	-1,3
-1	0,6
3	0,4

Bu nedenle, ağırlıklı toplam şu şekildedir:

weighted sum = (2)(-1.3) + (-1)(0.6) + (3)(0.4) = -2.0

Bu sinir ağının tasarımcısının, etkinleştirme işlevi olarak sigmoid işlevini seçtiğini varsayalım. Bu durumda nöron, yaklaşık 0,12 olan -2,0'ın sigmoid değerini hesaplar. Bu nedenle, nöron nöral ağdaki bir sonraki katmana -2,0 yerine 0,12 değerini iletir. Aşağıdaki şekilde, sürecin ilgili kısmı gösterilmektedir:

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Sinir ağları: Etkinleştirme işlevleri başlıklı makaleyi inceleyin.

yapay zeka

#fundamentals

Karmaşık görevleri çözebilen insan olmayan bir program veya model. Örneğin, metni çeviren bir program veya model ya da radyolojik görüntülerden hastalıkları tanımlayan bir program veya model yapay zeka gösterir.

Resmi olarak makine öğrenimi, yapay zekanın bir alt alanıdır. Ancak son yıllarda bazı kuruluşlar yapay zeka ve makine öğrenimi terimlerini birbirinin yerine kullanmaya başladı.

AUC (ROC eğrisinin altındaki alan)

#fundamentals

#Metric

İkili sınıflandırma modelinin pozitif sınıfları negatif sınıflardan ayırma becerisini gösteren 0,0 ile 1,0 arasında bir sayı. AUC değeri 1, 0'a ne kadar yakın olursa modelin sınıfları birbirinden ayırma yeteneği o kadar iyi olur.

Örneğin, aşağıdaki resimde pozitif sınıfları (yeşil oval) negatif sınıflardan (mor dikdörtgen) mükemmel şekilde ayıran bir sınıflandırma modeli gösterilmektedir. Bu gerçekçi olmayan mükemmel modelin AUC değeri 1,0'dır:

Bir tarafında 8 pozitif örnek, diğer tarafında 9 negatif örnek bulunan bir sayı doğrusu.

Buna karşılık, aşağıdaki resimde rastgele sonuçlar üreten bir sınıflandırma modelinin sonuçları gösterilmektedir. Bu modelin AUC değeri 0,5'tir:

6 pozitif örnek ve 6 negatif örnek içeren bir sayı doğrusu.
Örneklerin sırası olumlu, olumsuz, olumlu, olumsuz, olumlu, olumsuz, olumlu, olumsuz, olumlu, olumsuz, olumlu, olumsuz şeklindedir.

Evet, önceki modelin AUC değeri 0,0 değil 0,5.

Çoğu model, iki uç nokta arasında bir yerdedir. Örneğin, aşağıdaki model pozitifleri negatiflerden biraz ayırır ve bu nedenle 0,5 ile 1,0 arasında bir AUC'ye sahiptir:

6 pozitif örnek ve 6 negatif örnek içeren bir sayı doğrusu.
Örneklerin sırası: olumsuz, olumsuz, olumsuz, olumsuz, olumlu, olumsuz, olumlu, olumlu, olumsuz, olumlu, olumlu, olumlu.

AUC, sınıflandırma eşiği için ayarladığınız tüm değerleri yoksayar. Bunun yerine AUC, olası tüm sınıflandırma eşiklerini dikkate alır.

AUC ve ROC eğrileri arasındaki ilişki hakkında bilgi edinmek için simgeyi tıklayın.

AUC, ROC eğrisinin altındaki alanı temsil eder. Örneğin, pozitifleri negatiflerden mükemmel şekilde ayıran bir modelin ROC eğrisi aşağıdaki gibi görünür:

AUC, önceki resimde gri bölgenin alanıdır. Bu alışılmadık durumda alan, gri bölgenin uzunluğu (1,0) ile gri bölgenin genişliğinin (1,0) çarpımıdır. Bu nedenle, 1,0 ile 1,0'ın çarpımı tam olarak 1,0 AUC değerini verir. Bu, mümkün olan en yüksek AUC puanıdır.

Buna karşılık, sınıfları hiç ayıramayan bir sınıflandırma modelinin ROC eğrisi aşağıdaki gibidir. Bu gri bölgenin alanı 0,5'tir.

Daha tipik bir ROC eğrisi yaklaşık olarak aşağıdaki gibi görünür:

Bu eğrinin altındaki alanı manuel olarak hesaplamak çok zahmetli bir iş olur. Bu nedenle, çoğu AUC değeri genellikle bir program tarafından hesaplanır.

AUC'nin daha resmi bir tanımı için simgeyi tıklayın.

AUC, sınıflandırma modelinin rastgele seçilen pozitif bir örneğin gerçekten pozitif olduğuna, rastgele seçilen negatif bir örneğin pozitif olduğuna kıyasla daha fazla güvenme olasılığıdır.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sınıflandırma: ROC ve AUC başlıklı makaleyi inceleyin.

B

geri yayılım

#fundamentals

Nöral ağlarda gradyan inişini uygulayan algoritma.

Bir nöral ağı eğitmek için aşağıdaki iki geçişli döngünün birçok iterasyonu gerekir:

İleri geçiş sırasında sistem, tahminler elde etmek için toplu örnek işler. Sistem, her tahmini her etiket değeriyle karşılaştırır. Tahmin ile etiket değeri arasındaki fark, söz konusu örnek için kayıptır. Sistem, mevcut toplu işin toplam kaybını hesaplamak için tüm örneklerin kayıplarını toplar.
Geriye doğru geçiş (geri yayılım) sırasında sistem, tüm gizli katmanlardaki tüm nöronların ağırlıklarını ayarlayarak kaybı azaltır.

Nöral ağlar genellikle birçok gizli katmanda çok sayıda nöron içerir. Bu nöronların her biri genel kayba farklı şekillerde katkıda bulunur. Geriye yayılım, belirli nöronlara uygulanan ağırlıkların artırılıp azaltılmayacağını belirler.

Öğrenme oranı, her bir geri geçişin her ağırlığı artırma veya azaltma derecesini kontrol eden bir çarpandır. Büyük bir öğrenme hızı, her ağırlığı küçük bir öğrenme hızına göre daha fazla artırır veya azaltır.

Kalkülüs açısından, geri yayılım, kalkülüsteki zincir kuralını uygular. Yani, geriye yayılım, hatanın her bir parametreye göre kısmi türevini hesaplar.

Yıllar önce makine öğrenimi uzmanları, geri yayılımı uygulamak için kod yazmak zorundaydı. Keras gibi modern makine öğrenimi API'leri artık sizin için geri yayılımı uygular. Bora

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Nöral ağlar bölümüne bakın.

grup

#fundamentals

Bir eğitim iterasyonunda kullanılan örnekler kümesi. Toplu iş boyutu, toplu işteki örneklerin sayısını belirler.

Bir grubun dönemle nasıl ilişkili olduğuna dair açıklama için dönem başlıklı makaleyi inceleyin.

Daha fazla bilgi için Makine Öğrenimine Hızlı Bakış Kursu'ndaki Doğrusal regresyon: Hiperparametreler bölümüne bakın.

grup boyutu

#fundamentals

Bir toplu işlemdeki örneklerin sayısı. Örneğin, toplu iş boyutu 100 ise model, iterasyon başına 100 örnek işler.

Popüler toplu iş boyutu stratejileri şunlardır:

Stokastik Gradyan İnişi (SGD): Bu yöntemde toplu iş boyutu 1'dir.
Tam toplu iş: Toplu iş boyutu, eğitim kümesinin tamamındaki örneklerin sayısıdır. Örneğin, eğitim kümesi bir milyon örnek içeriyorsa toplu iş boyutu bir milyon örnek olur. Tam toplu iş genellikle verimsiz bir stratejidir.
Toplu iş boyutunun genellikle 10 ile 1.000 arasında olduğu mini toplu iş. Mini toplu iş genellikle en verimli stratejidir.

Daha fazla bilgi için aşağıdaki konulara bakın:

Makine Öğrenimi Hızlandırılmış Kursu'nda Üretim ML sistemleri: Statik ve dinamik çıkarım.
Derin Öğrenme Ayarlama Başucu Kitabı.

önyargı (etik/adalet)

#responsible

#fundamentals

1. Bazı şeylere, kişilere veya gruplara yönelik stereotipleştirme, önyargı veya kayırma. Bu önyargılar, verilerin toplanmasını ve yorumlanmasını, sistemin tasarımını ve kullanıcıların sistemle etkileşim kurma şeklini etkileyebilir. Bu tür yanlılığın biçimleri şunlardır:

2. Örnekleme veya raporlama prosedürüyle ortaya çıkan sistematik hata. Bu tür yanlılığın biçimleri şunlardır:

kapsam yanlılığı (coverage bias)
yanıt vermeme eğilimi (non-response bias)
katılım önyargısı (participation bias)
raporlama yanlılığı
örnekleme yanlılığı
seçim önyargısı

Makine öğrenimi modellerindeki bias terimi veya tahmin yanlılığı ile karıştırılmamalıdır.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Adalet: Önyargı türleri bölümüne bakın.

önyargı (matematik) veya önyargı terimi

#fundamentals

Bir başlangıç noktasından kesişme veya uzaklık. Yanılgı, makine öğrenimi modellerindeki bir parametredir ve aşağıdakilerden biriyle sembolize edilir:

b
w₀

Örneğin, aşağıdaki formülde b, yanlılığı ifade eder:

$$y' = b + w_1x_1 + w_2x_2 + … w_nx_n$$

Basit bir iki boyutlu çizgide, sapma yalnızca "y eksenini kesen nokta" anlamına gelir. Örneğin, aşağıdaki resimde çizginin eğimi 2'dir.

Eğimi 0,5 ve önyargısı (y eksenini kestiği nokta) 2 olan bir doğrunun grafiği.

Tüm modeller başlangıç noktasından (0,0) başlamadığı için önyargı vardır. Örneğin, bir eğlence parkına girişin 2 avro, müşterinin parkta kaldığı her saat için ise 0,5 avro ek ücret alındığını varsayalım. Bu nedenle, toplam maliyeti eşleyen bir modelde en düşük maliyet 2 Euro olduğundan 2 birimi kadar bir sapma vardır.

Önyargı, etik ve adalet alanındaki önyargı veya tahmin önyargısı ile karıştırılmamalıdır.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Doğrusal Regresyon bölümüne bakın.

ikili sınıflandırma

#fundamentals

Bir sınıflandırma görevi türü. Birbiriyle bağdaşmayan iki sınıftan birini tahmin eder:

pozitif sınıf
negatif sınıf

Örneğin, aşağıdaki iki makine öğrenimi modelinin her biri ikili sınıflandırma gerçekleştirir:

E-posta iletilerinin spam (pozitif sınıf) veya spam değil (negatif sınıf) olup olmadığını belirleyen bir model.
Bir kişinin belirli bir hastalığa (pozitif sınıf) sahip olup olmadığını veya bu hastalığa sahip olmadığını (negatif sınıf) belirlemek için tıbbi semptomları değerlendiren bir model.

Çok sınıflı sınıflandırma ile karşılaştırın.

Lojistik regresyon ve sınıflandırma eşiği bölümlerini de inceleyin.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Sınıflandırma bölümüne bakın.

gruplandırma

#fundamentals

Tek bir özelliği, genellikle bir değer aralığına dayalı olarak paketler veya gruplar adı verilen birden fazla ikili özelliğe dönüştürme. Kırpma özelliği genellikle sürekli bir özelliktir.

Örneğin, sıcaklığı tek bir sürekli kayan nokta özelliği olarak temsil etmek yerine sıcaklık aralıklarını aşağıdaki gibi ayrı gruplara ayırabilirsiniz:

≤ 10 santigrat derece sıcaklık, "soğuk" grubu olarak değerlendirilir.
11-24 santigrat derece "ılıman" grubu olarak değerlendirilir.
>= 25 santigrat derece "sıcak" grubu olur.

Model, aynı gruptaki her değere aynı şekilde davranır. Örneğin, 13 ve 22 değerleri ılıman aralığında olduğundan model, bu iki değeri aynı şekilde ele alır.

Ek notlar için simgeyi tıklayın.

Sıcaklığı sürekli bir özellik olarak temsil ederseniz model, sıcaklığı tek bir özellik olarak ele alır. Sıcaklığı üç grup halinde temsil ediyorsanız model her grubu ayrı bir özellik olarak ele alır. Yani bir model, her grubun etiketle ayrı ilişkilerini öğrenebilir. Örneğin, bir doğrusal regresyon modeli, her grup için ayrı ağırlıklar öğrenebilir.

Kutu sayısını artırmak, modelinizin öğrenmesi gereken ilişki sayısını artırarak modelinizi daha karmaşık hale getirir. Örneğin, soğuk, ılıman ve sıcak grupları, modelinizin eğitileceği üç ayrı özelliktir. İki tane daha grup eklemeye karar verirseniz (ör. dondurucu ve sıcak) modelinizin artık beş ayrı özellik üzerinde eğitilmesi gerekir.

Kaç tane grup oluşturacağınızı veya her bir grubun aralıklarının ne olması gerektiğini nasıl bileceksiniz? Yanıtlar genellikle önemli ölçüde deneme gerektirir.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Sayısal veriler: Gruplandırma bölümüne bakın.

C

kategorik veriler

#fundamentals

Belirli bir olası değerler kümesine sahip özellikler. Örneğin, yalnızca aşağıdaki üç olası değerden birine sahip olabilen traffic-light-state adlı kategorik bir özelliği ele alalım:

red
yellow
green

traffic-light-state kategorik bir özellik olarak temsil edildiğinde model, red, green ve yellow'nin sürücü davranışı üzerindeki farklı etkilerini öğrenebilir.

Kategorik özelliklere bazen ayrık özellikler de denir.

Sayısal verilerle karşılaştırın.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Kategorik verilerle çalışma konusuna bakın.

sınıf

#fundamentals

Etiketin ait olabileceği bir kategori. Örneğin:

Spam'i algılayan bir ikili sınıflandırma modelinde iki sınıf spam ve spam değil olabilir.
Köpek ırklarını tanımlayan bir çok sınıflı sınıflandırma modelinde sınıflar kaniş, beagle, pug vb. olabilir.

Sınıflandırma modeli bir sınıfı tahmin eder. Bunun aksine, regresyon modeli bir sınıf yerine bir sayı tahmin eder.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Sınıflandırma bölümüne bakın.

sınıflandırma modeli

#fundamentals

Tahmini sınıf olan model. Örneğin, aşağıdakilerin tümü sınıflandırma modelidir:

Bir giriş cümlesinin dilini tahmin eden bir model (Fransızca mı? İspanyolca mı? İtalyanca mı?).
Ağaç türlerini tahmin eden bir model (Akçaağaç mı? Meşe? Baobab?).
Belirli bir tıbbi durum için pozitif veya negatif sınıfı tahmin eden bir model.

Bunun aksine, regresyon modelleri sınıflar yerine sayıları tahmin eder.

Sık kullanılan iki sınıflandırma modeli türü şunlardır:

ikili sınıflandırma
çok sınıflı sınıflandırma

sınıflandırma eşiği

#fundamentals

İkili sınıflandırmada, lojistik regresyon modelinin ham çıkışını pozitif sınıf veya negatif sınıf tahminine dönüştüren 0 ile 1 arasında bir sayıdır. Sınıflandırma eşiğinin, model eğitimi tarafından seçilen bir değer değil, bir insan tarafından seçilen bir değer olduğunu unutmayın.

Lojistik regresyon modeli, 0 ile 1 arasında bir ham değer çıkarır. Ardından:

Bu ham değer, sınıflandırma eşiğinden büyükse pozitif sınıf tahmin edilir.
Bu ham değer, sınıflandırma eşiğinden küçükse negatif sınıf tahmin edilir.

Örneğin, sınıflandırma eşiğinin 0,8 olduğunu varsayalım. Ham değer 0, 9 ise model pozitif sınıfı tahmin eder. Ham değer 0, 7 ise model negatif sınıfı tahmin eder.

Sınıflandırma eşiğinin seçimi, yanlış pozitif ve yanlış negatif sayısını büyük ölçüde etkiler.

Ek notlar için simgeyi tıklayın.

Modeller veya veri kümeleri geliştikçe mühendisler bazen sınıflandırma eşiğini de değiştirir. Sınıflandırma eşiği değiştiğinde pozitif sınıf tahminleri aniden negatif sınıflara, negatif sınıf tahminleri ise pozitif sınıflara dönüşebilir.

Örneğin, ikili sınıflandırma hastalığı tahmin modelini ele alalım. Sistemin ilk yıl çalıştığını varsayalım:

Belirli bir hastanın ham değeri 0,95'tir.
Sınıflandırma eşiği 0,94'tür.

Bu nedenle sistem, pozitif sınıfı teşhis eder. (Hasta nefes nefese kalır, "Olamaz! Hastayım!")

Bir yıl sonra değerler aşağıdaki gibi görünebilir:

Aynı hasta için ham değer 0,95 olarak kalır.
Sınıflandırma eşiği 0,97 olarak değişir.

Bu nedenle, sistem artık bu hastayı negatif sınıf olarak yeniden sınıflandırır. ("Mutlu gün! Hasta değilim.") Aynı hasta. Farklı teşhis.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Eşikler ve karmaşıklık matrisi bölümüne bakın.

sınıflandırıcı

#fundamentals

Sınıflandırma modeli için kullanılan gayri resmi bir terimdir.

sınıf dengesizliği olan veri kümesi

#fundamentals

Her bir sınıfın toplam etiket sayısının önemli ölçüde farklı olduğu bir sınıflandırma için veri kümesi. Örneğin, iki etiketi aşağıdaki gibi ayrılmış bir ikili sınıflandırma veri kümesini ele alalım:

1.000.000 negatif etiket
10 pozitif etiket

Negatif ve pozitif etiketlerin oranı 100.000'e 1 olduğundan bu, sınıf dengesizliği olan bir veri kümesidir.

Buna karşılık, aşağıdaki veri kümesi sınıf dengelidir. Bunun nedeni, olumsuz etiketlerin olumlu etiketlere oranının 1'e nispeten yakın olmasıdır:

517 negatif etiket
483 pozitif etiket

Çok sınıflı veri kümelerinde sınıf dengesizliği de olabilir. Örneğin, aşağıdaki çok sınıflı sınıflandırma veri kümesi de sınıf dengesizdir. Bunun nedeni, bir etiketin diğer iki etikete kıyasla çok daha fazla örnek içermesidir:

"Yeşil" sınıfına sahip 1.000.000 etiket
"Mor" sınıfına ait 200 etiket
"turuncu" sınıfına ait 350 etiket

Sınıf dengesizliği olan veri kümelerini eğitmek özel zorluklar yaratabilir. Ayrıntılar için Makine Öğrenimine Giriş Kursu'ndaki Dengesiz veri kümeleri bölümüne bakın.

Entropi, çoğunluk sınıfı ve azınlık sınıfı bölümlerini de inceleyin.

kırpma

#fundamentals

Aşağıdakilerden birini veya her ikisini birden yaparak aykırı değerleri işleme tekniği:

Maksimum eşiği aşan özellik değerlerini bu maksimum eşiğe düşürme.
Minimum eşiğin altındaki özellik değerlerini bu minimum eşiğe kadar artırır.

Örneğin, belirli bir özelliğin değerlerinin% 0,5'inden azının 40-60 aralığının dışında olduğunu varsayalım. Bu durumda şunları yapabilirsiniz:

60'tan (maksimum eşik) yüksek tüm değerleri tam olarak 60 olarak kırpın.
40'ın (minimum eşik) altındaki tüm değerleri tam olarak 40 olacak şekilde kırpın.

Aykırı değerler modellere zarar verebilir ve bazen eğitim sırasında ağırlıkların taşmasına neden olabilir. Bazı aykırı değerler, doğruluk gibi metrikleri de önemli ölçüde etkileyebilir. Kırpma, hasarı sınırlamak için yaygın olarak kullanılan bir tekniktir.

Gradyan kırpma, eğitim sırasında gradyan değerlerini belirlenmiş bir aralıkta tutar.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Sayısal veriler: Normalleştirme bölümüne bakın.

karışıklık matrisi

#fundamentals

Sınıflandırma modelinin yaptığı doğru ve yanlış tahminlerin sayısını özetleyen NxN tablosu. Örneğin, bir ikili sınıflandırma modeli için aşağıdaki karmaşıklık matrisini inceleyin:

	Tümör (tahmini)	Non-Tumor (predicted) [Non-Tümör (tahmini)]
Tümör (kesin referans)	18 (TP)	1 (FN)
Non-Tumor (ground truth)	6 (FP)	452 (TN)

Önceki karışıklık matrisinde şunlar gösterilmektedir:

Kesin referansın tümör olduğu 19 tahminden 18'i doğru, 1'i ise yanlış sınıflandırıldı.
Kesin referansın Non-Tumor olduğu 458 tahminden 452'si doğru, 6'sı ise yanlış sınıflandırıldı.

Çok sınıflı sınıflandırma sorununa ilişkin karışıklık matrisi, hata kalıplarını belirlemenize yardımcı olabilir. Örneğin, üç farklı iris türünü (Virginica, Versicolor ve Setosa) sınıflandıran 3 sınıflı çok sınıflı sınıflandırma modelinin aşağıdaki karmaşıklık matrisini ele alalım. Kesin referans Virginica olduğunda karmaşıklık matrisi, modelin Setosa'dan ziyade Versicolor'u yanlışlıkla tahmin etme olasılığının çok daha yüksek olduğunu gösteriyor:

	Setosa (tahmin edilen)	Versicolor (tahmin edilen)	Virginica (tahmini)
Setosa (kesin referans)	88	12	0
Versicolor (kesin referans)	6	141	7
Virginica (kesin referans)	2	27	109

Başka bir örnek olarak, bir karmaşıklık matrisi, el yazısıyla yazılmış rakamları tanımak için eğitilmiş bir modelin 4 yerine yanlışlıkla 9'u veya 7 yerine yanlışlıkla 1'i tahmin etme eğiliminde olduğunu ortaya çıkarabilir.

Karmaşıklık matrisleri, kesinlik ve hatırlama dahil olmak üzere çeşitli performans metriklerini hesaplamak için yeterli bilgiyi içerir.

sürekli özellik

#fundamentals

Sıcaklık veya ağırlık gibi sonsuz sayıda olası değere sahip kayan noktalı özellik.

Ayrık özellik ile karşılaştırma.

yakınsama

#fundamentals

Kayıp değerlerinin her yinelemede çok az değiştiği veya hiç değişmediği durumda ulaşılan durum. Örneğin, aşağıdaki kayıp eğrisi, yaklaşık 700 yinelemede yakınsama olduğunu gösteriyor:

Kartezyen grafiği. X ekseni kayıptır. Y ekseni, eğitim iterasyonlarının sayısıdır. İlk birkaç yinelemede kayıp çok yüksek olsa da keskin bir şekilde düşer. Yaklaşık 100 iterasyondan sonra kayıp hâlâ azalıyor ancak çok daha yavaş bir şekilde. Yaklaşık 700 yinelemeden sonra kayıp sabit kalır.

Ek eğitim modelin performansını artırmadığında model yakınlaşır.

Derin öğrenmede, kayıp değerleri sonunda düşmeden önce bazen birçok yineleme boyunca sabit kalır veya neredeyse sabit kalır. Uzun bir süre boyunca sürekli kayıp değerleri yaşandığında geçici olarak yanlış bir yakınsama hissi elde edebilirsiniz.

Erken durdurma başlıklı makaleyi de inceleyin.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Model yakınsama ve kayıp eğrileri bölümüne bakın.

D

DataFrame

#fundamentals

Bellekteki veri kümelerini temsil etmek için kullanılan popüler bir pandas veri türü.

DataFrame, tabloya veya e-tabloya benzer. DataFrame'in her sütununun bir adı (başlık) vardır ve her satır benzersiz bir sayıyla tanımlanır.

DataFrame'deki her sütun, her sütuna kendi veri türü atanabilmesi dışında 2 boyutlu bir dizi gibi yapılandırılır.

Ayrıca resmi pandas.DataFrame referans sayfasına da bakın.

veri kümesi veya veri kümesi

#fundamentals

Genellikle (ancak yalnızca değil) aşağıdaki biçimlerden birinde düzenlenen bir ham veri koleksiyonu:

e-tablo
CSV (virgülle ayrılmış değerler) biçiminde bir dosya

deep model

#fundamentals

Birden fazla gizli katman içeren bir nöral ağ.

Derin model, derin nöral ağ olarak da adlandırılır.

Geniş model ile karşılaştırma

yoğun özellik

#fundamentals

Çoğu veya tüm değerlerin sıfır olmadığı bir özellik. Genellikle kayan nokta değerlerinden oluşan bir tensördür. Örneğin, aşağıdaki 10 öğeli tensör, değerlerinin 9'u sıfır olmayan değerler olduğundan yoğundur:

Seyrek özellik ile karşılaştırma.

derinlik

#fundamentals

Nöral ağda aşağıdakilerin toplamı:

Gizli katmanların sayısı
Genellikle 1 olan çıkış katmanlarının sayısı
herhangi bir yerleştirme katmanının sayısı

Örneğin, beş gizli katmanı ve bir çıkış katmanı olan bir nöral ağın derinliği 6'dır.

Giriş katmanının derinliği etkilemediğini unutmayın.

ayrı özellik

#fundamentals

Sınırlı sayıda olası değere sahip bir özellik. Örneğin, değerleri yalnızca hayvan, sebze veya mineral olabilen bir özellik, ayrı (veya kategorik) bir özelliktir.

Sürekli özellik ile karşılaştırın.

dinamik

#fundamentals

Sık sık veya sürekli olarak yapılan bir şey. Dinamik ve online terimleri, makine öğreniminde eş anlamlıdır. Aşağıda, makine öğreniminde dinamik ve çevrimiçi terimlerinin yaygın kullanım alanları verilmiştir:

Dinamik model (veya online model), sık sık ya da sürekli olarak yeniden eğitilen bir modeldir.
Dinamik eğitim (veya online eğitim), sık sık ya da sürekli olarak eğitim verme sürecidir.
Dinamik çıkarım (veya online çıkarım), isteğe bağlı olarak tahmin oluşturma işlemidir.

dinamik model

#fundamentals

Sık sık (hatta sürekli olarak) yeniden eğitilen bir model. Dinamik model, sürekli olarak gelişen verilere uyum sağlayan bir "hayat boyu öğrenen"dir. Dinamik model, online model olarak da bilinir.

Statik model ile karşılaştırma

E

erken durdurma

#fundamentals

Eğitim kaybı azalmayı bitirmeden eğitimi sonlandırmayı içeren bir düzenlileştirme yöntemidir. Erken durdurmada, doğrulama veri kümesindeki kayıp artmaya başladığında (yani genelleme performansı kötüleştiğinde) modeli eğitme işlemini kasıtlı olarak durdurursunuz.

Ek notlar için simgeyi tıklayın.

Erken durdurma, sezgisel olarak yanlış görünebilir. Sonuçta, kayıp hâlâ azalırken bir modele eğitimi durdurmasını söylemek, bir şefe tatlı tamamen pişmeden pişirmeyi bırakmasını söylemeye benzer. Ancak bir modeli çok uzun süre eğitmek aşırı uyuma yol açabilir. Yani bir modeli çok uzun süre eğitirseniz model, eğitim verilerine o kadar yakın bir şekilde uyabilir ki yeni örnekler üzerinde iyi tahminler yapamaz.

Erken çıkış ile karşılaştırın.

yerleştirme katmanı

#fundamentals

Yüksek boyutlu kategorik bir özellik üzerinde eğitim alarak düşük boyutlu bir yerleştirme vektörünü kademeli olarak öğrenen özel bir gizli katman. Yerleştirme katmanı, bir nöral ağın yalnızca yüksek boyutlu kategorik özellik üzerinde eğitim yapmaya kıyasla çok daha verimli bir şekilde eğitilmesini sağlar.

Örneğin, Earth şu anda yaklaşık 73.000 ağaç türünü desteklemektedir. Ağaç türünün modelinizde bir özellik olduğunu varsayalım. Bu durumda modelinizin giriş katmanı, 73.000 öğe uzunluğunda bir tek sıcak vektör içerir. Örneğin, baobab sembolü şu şekilde gösterilebilir:

73.000 öğeden oluşan bir dizi. İlk 6.232 öğe 0 değerini içerir. Sonraki öğe 1 değerini içerir. Son 66.767 öğe sıfır değerini içerir.

73.000 öğeli bir dizi çok uzundur. Modele yerleştirme katmanı eklemezseniz 72.999 sıfırın çarpılması nedeniyle eğitim çok zaman alır. Örneğin, yerleştirme katmanının 12 boyuttan oluşmasını seçebilirsiniz. Sonuç olarak, yerleştirme katmanı her ağaç türü için kademeli olarak yeni bir yerleştirme vektörü öğrenir.

Belirli durumlarda karma oluşturma, yerleştirme katmanına makul bir alternatiftir.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Yerleştirme bölümüne bakın.

sıfır zaman

#fundamentals

Her bir örneğin bir kez işlendiği, eğitim kümesinin tamamında tam bir eğitim geçişi.

Bir dönem, N/toplu iş boyutu eğitim iterasyonunu ifade eder. Burada N, toplam örnek sayısıdır.

Örneğin, aşağıdakileri varsayalım:

Veri kümesi 1.000 örnekten oluşur.
Toplu iş boyutu 50 örnektir.

Bu nedenle, tek bir dönem için 20 yineleme gerekir:

1 epoch = (N/batch size) = (1,000 / 50) = 20 iterations

Daha fazla bilgi için Makine Öğrenimine Hızlı Bakış Kursu'ndaki Doğrusal regresyon: Hiperparametreler bölümüne bakın.

örnek

#fundamentals

Özellikler satırının değerleri ve muhtemelen bir etiket. Gözetimli öğrenme kapsamındaki örnekler iki genel kategoriye ayrılır:

Etiketli örnek, bir veya daha fazla özellik ve bir etiketten oluşur. Eğitim sırasında etiketli örnekler kullanılır.
Etiketsiz örnek, bir veya daha fazla özellikten oluşur ancak etiketi yoktur. Çıkarım sırasında etiketlenmemiş örnekler kullanılır.

Örneğin, hava koşullarının öğrencilerin test puanları üzerindeki etkisini belirlemek için bir model eğittiğinizi varsayalım. Aşağıda etiketlenmiş üç örnek verilmiştir:

Özellikler			Şirket
Sıcaklık	Nem	Basınç	Test puanı
15	47	998	İyi
19	34	1020	Mükemmel
18	92	1012	Yetersiz

Etiketlenmemiş üç örneği aşağıda bulabilirsiniz:

Sıcaklık	Nem	Basınç
12	62	1014
21	47	1017
19	41	1021

Veri kümesinin satırı genellikle bir örnek için ham kaynaktır. Yani bir örnek genellikle veri kümesindeki sütunların bir alt kümesinden oluşur. Ayrıca, bir örnekteki özellikler özellik çarpımları gibi sentezlenmiş özellikleri de içerebilir.

Daha fazla bilgi için Makine Öğrenimine Giriş kursundaki Denetimli Öğrenme bölümüne bakın.

C

yanlış negatif (FN)

#fundamentals

#Metric

Modelin negatif sınıfı yanlışlıkla tahmin ettiği bir örnek. Örneğin, model belirli bir e-posta iletisinin spam olmadığını (negatif sınıf) tahmin ediyor ancak bu e-posta iletisi aslında spam.

yanlış pozitif (FP)

#fundamentals

#Metric

Modelin pozitif sınıfı yanlışlıkla tahmin ettiği bir örnek. Örneğin, model belirli bir e-posta iletisinin spam (pozitif sınıf) olduğunu tahmin ediyor ancak bu e-posta iletisi aslında spam değil.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Eşikler ve karmaşıklık matrisi bölümüne bakın.

Yanlış pozitif oranı (FPR)

#fundamentals

#Metric

Modelin pozitif sınıfı yanlışlıkla tahmin ettiği gerçek negatif örneklerin oranı. Aşağıdaki formül, yanlış pozitif oranını hesaplar:

$$\text{false positive rate} = \frac{\text{false positives}}{\text{false positives} + \text{true negatives}}$$

Yanlış pozitif oranı, ROC eğrisindeki x eksenidir.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sınıflandırma: ROC ve AUC başlıklı makaleyi inceleyin.

özellik

#fundamentals

Bir makine öğrenimi modelinin giriş değişkeni. Bir örnek bir veya daha fazla özellikten oluşur. Örneğin, hava koşullarının öğrencilerin sınav puanları üzerindeki etkisini belirlemek için bir model eğittiğinizi varsayalım. Aşağıdaki tabloda, her biri üç özellik ve bir etiket içeren üç örnek gösterilmektedir:

Özellikler			Şirket
Sıcaklık	Nem	Basınç	Test puanı
15	47	998	92
19	34	1020	84
18	92	1012	87

Etiketle kontrast.

Daha fazla bilgi için Makine Öğrenimine Giriş kursundaki Gözetimli Öğrenme bölümüne bakın.

özellikler arası

#fundamentals

Kategorik veya gruplandırılmış özelliklerin "çaprazlanmasıyla" oluşturulan bir sentez özellik.

Örneğin, sıcaklığı aşağıdaki dört gruptan birinde gösteren bir "hava durumu tahmini" modelini ele alalım:

freezing
chilly
temperate
warm

Ayrıca rüzgar hızını aşağıdaki üç gruptan birinde gösterir:

still
light
windy

Özellikler arası geçiş olmadan doğrusal model, önceki yedi farklı paketin her birinde bağımsız olarak eğitilir. Bu nedenle model, örneğin, freezing üzerinde eğitilirken örneğin, windy üzerinde eğitimden bağımsızdır.

Alternatif olarak, sıcaklık ve rüzgar hızının bir özellik kesişimini oluşturabilirsiniz. Bu yapay özellik aşağıdaki 12 olası değere sahip olacaktır:

freezing-still
freezing-light
freezing-windy
chilly-still
chilly-light
chilly-windy
temperate-still
temperate-light
temperate-windy
warm-still
warm-light
warm-windy

Özellik kesişimleri sayesinde model, freezing-windy günü ile freezing-still günü arasındaki ruh hali farklılıklarını öğrenebilir.

Her biri çok sayıda farklı pakete sahip iki özellikten yapay bir özellik oluşturursanız ortaya çıkan özellik kesişimi çok sayıda olası kombinasyona sahip olur. Örneğin, bir özellikte 1.000 grup, diğer özellikte 2.000 grup varsa sonuçtaki özellik kesişiminde 2.000.000 grup bulunur.

Resmi olarak, çarpım bir Kartezyen çarpımıdır.

Özellik çaprazları çoğunlukla doğrusal modellerle kullanılır ve nöral ağlarla nadiren kullanılır.

Daha fazla bilgi için Categorical data: Feature crosses in Machine Learning Crash Course (Kategorik veriler: Makine Öğrenimi Hızlandırılmış Kursu'nda özellik kesişimleri) başlıklı makaleyi inceleyin.

özellik mühendisliği

#fundamentals

#TensorFlow

Aşağıdaki adımları içeren bir süreç:

Bir modeli eğitirken hangi özelliklerin faydalı olabileceğini belirleme.
Veri kümesindeki ham verileri bu özelliklerin etkili sürümlerine dönüştürme.

Örneğin, temperature özelliğinin faydalı olabileceğini belirleyebilirsiniz. Ardından, modelin farklı temperature aralıklarından neler öğrenebileceğini optimize etmek için gruplandırma ile denemeler yapabilirsiniz.

Özellik mühendisliğine bazen özellik çıkarma veya özellik oluşturma da denir.

TensorFlow ile ilgili ek notlar için simgeyi tıklayın.

TensorFlow'da özellik mühendisliği genellikle ham günlük dosyası girişlerini tf.Example protokol arabelleklerine dönüştürmek anlamına gelir. Ayrıca tf.Transform'u da inceleyin.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sayısal veriler: Bir model, özellik vektörlerini kullanarak verileri nasıl alır? başlıklı makaleyi inceleyin.

özellik grubu

#fundamentals

Makine öğrenimi modelinizin üzerinde eğitildiği özellikler grubu. Örneğin, konut fiyatlarını tahmin eden bir model için basit bir özellik grubu; posta kodu, mülk boyutu ve mülkün durumundan oluşabilir.

özellik vektörü

#fundamentals

Bir örneği oluşturan özellik değerleri dizisi. Özellik vektörü, eğitim ve çıkarım sırasında giriş olarak kullanılır. Örneğin, iki ayrı özelliği olan bir modelin özellik vektörü şu şekilde olabilir:

[0.92, 0.56]

Dört katman: giriş katmanı, iki gizli katman ve bir çıkış katmanı.
Giriş katmanı iki düğüm içerir. Bunlardan biri 0,92 değerini, diğeri ise 0,56 değerini içerir.

Her örnek, özellik vektörü için farklı değerler sağlar. Bu nedenle, sonraki örneğin özellik vektörü şu şekilde olabilir:

[0.73, 0.49]

Özellik mühendisliği, özelliklerin özellik vektöründe nasıl temsil edileceğini belirler. Örneğin, beş olası değeri olan ikili bir kategorik özellik, one-hot kodlama ile temsil edilebilir. Bu durumda, belirli bir örnek için özellik vektörünün bölümü, aşağıdaki gibi dört sıfır ve üçüncü konumda tek bir 1,0'dan oluşur:

[0.0, 0.0, 1.0, 0.0, 0.0]

Başka bir örnek olarak, modelinizin üç özellikten oluştuğunu varsayalım:

Tek sıcaklık kodlamasıyla temsil edilen beş olası değere sahip ikili kategorik özellik; örneğin: [0.0, 1.0, 0.0, 0.0, 0.0]
One-hot kodlamayla gösterilen üç olası değere sahip başka bir ikili kategorik özellik; örneğin: [0.0, 0.0, 1.0]
Kayan nokta özelliği; örneğin: 8.3.

Bu durumda, her örnek için özellik vektörü dokuz değerle temsil edilir. Yukarıdaki listedeki örnek değerler göz önüne alındığında, özellik vektörü şu şekilde olur:

0.0
1.0
0.0
0.0
0.0
0.0
0.0
1.0
8.3

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sayısal veriler: Bir model, özellik vektörlerini kullanarak verileri nasıl alır? başlıklı makaleyi inceleyin.

geri bildirim döngüsü

#fundamentals

Makine öğreniminde, bir modelin tahminlerinin aynı modelin veya başka bir modelin eğitim verilerini etkilediği durum. Örneğin, film öneren bir model, kullanıcıların gördüğü filmleri etkiler. Bu da sonraki film önerisi modellerini etkiler.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Üretim ML sistemleri: Sorulması gereken sorular bölümüne bakın.

G

genelleştirme

#fundamentals

Modelin yeni ve daha önce görülmemiş verilerle ilgili doğru tahminler yapabilme özelliği. Genelleme yapabilen bir model, aşırı uyum gösteren bir modelin tam tersidir.

Ek notlar için simgeyi tıklayın.

Eğitim kümesindeki örnekler üzerinde bir model eğitirsiniz. Sonuç olarak, model eğitim kümesindeki verilerin özelliklerini öğrenir. Genelleme, modelinizin eğitim kümesinde olmayan örnekler üzerinde iyi tahminler yapıp yapamayacağını sorar.

Genelleştirmeyi teşvik etmek için düzenlileştirme, modelin eğitim kümesindeki verilerin özelliklerine daha az uygun şekilde eğitilmesine yardımcı olur.

Daha fazla bilgi için Makine Öğrenimine Giriş Hızlandırılmış Kursu'ndaki Genelleştirme bölümüne bakın.

genelleştirme eğrisi

#fundamentals

Eğitim kaybı ve doğrulama kaybının, iterasyon sayısının bir fonksiyonu olarak grafiği.

Genelleştirme eğrisi, olası aşırı uyumu tespit etmenize yardımcı olabilir. Örneğin, aşağıdaki genelleştirme eğrisi, doğrulama kaybı nihayetinde eğitim kaybından önemli ölçüde yüksek olduğu için aşırı uyumu gösterir.

Y ekseninde kayıp, x ekseninde ise yineleme etiketinin bulunduğu bir Kartezyen grafik. İki grafik gösterilir. Grafiklerden biri eğitim kaybını, diğeri ise doğrulama kaybını gösterir.
İki grafik benzer şekilde başlar ancak eğitim kaybı sonunda doğrulama kaybından çok daha düşük bir seviyeye iner.

Daha fazla bilgi için Makine Öğrenimine Giriş Hızlandırılmış Kursu'ndaki Genelleştirme bölümüne bakın.

gradyan inişi

#fundamentals

Kayıpları en aza indirmek için kullanılan matematiksel bir teknik. Gradyan inişi, ağırlıkları ve önyargıları yinelemeli olarak ayarlar ve kaybı en aza indirecek en iyi kombinasyonu yavaş yavaş bulur.

Gradyan inişi, makine öğreniminden çok daha eski bir yöntemdir.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Doğrusal regresyon: Gradyen inişi bölümüne bakın.

kesin referans

#fundamentals

Gerçeklik.

Gerçekte olan şey.

Örneğin, üniversitenin ilk yılında olan bir öğrencinin altı yıl içinde mezun olup olmayacağını tahmin eden bir ikili sınıflandırma modelini ele alalım. Bu model için kesin referans, öğrencinin altı yıl içinde gerçekten mezun olup olmadığıdır.

Ek notlar için simgeyi tıklayın.

Model kalitesini kesin referansla karşılaştırarak değerlendiririz. Ancak gerçek veriler her zaman tamamen doğru olmayabilir. Örneğin, kesin referanstaki olası kusurlarla ilgili aşağıdaki örnekleri inceleyin:

Mezuniyet örneğinde, her öğrencinin mezuniyet kayıtlarının her zaman doğru olduğundan emin miyiz? Üniversitenin kayıt tutma sistemi kusursuz mu?
Etiketin, cihazlarla (ör. barometreler) ölçülen bir kayan nokta değeri olduğunu varsayalım. Her enstrümanın aynı şekilde kalibre edildiğinden veya her okumanın aynı koşullarda yapıldığından nasıl emin olabiliriz?
Etiket, insan görüşüne bağlıysa her bir değerlendiricinin etkinlikleri aynı şekilde değerlendirdiğinden nasıl emin olabiliriz? Tutarlılığı artırmak için bazen uzman derecelendirme uzmanları müdahale eder.

H

gizli katman

#fundamentals

Giriş katmanı (özellikler) ile çıkış katmanı (tahmin) arasındaki sinir ağındaki bir katman. Her gizli katman bir veya daha fazla nöron içerir. Örneğin, aşağıdaki sinir ağında iki gizli katman vardır. Birincisinde üç nöron, ikincisinde ise iki nöron bulunur:

Derin nöral ağ, birden fazla gizli katman içerir. Örneğin, önceki resim bir derin sinir ağıdır çünkü model iki gizli katman içerir.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Sinir ağları: Düğümler ve gizli katmanlar başlıklı makaleyi inceleyin.

hiperparametre

#fundamentals

Sizin veya bir hiperparametre ayarı hizmetinin bir modeli eğitmenin ardışık çalıştırmaları sırasında ayarladığı değişkenler. Örneğin, öğrenme oranı bir hiperparametredir. Bir eğitim oturumundan önce öğrenme hızını 0,01 olarak ayarlayabilirsiniz. 0,01 değerinin çok yüksek olduğuna karar verirseniz bir sonraki eğitim oturumunda öğrenme hızını 0,003 olarak ayarlayabilirsiniz.

Buna karşılık parametreler, modelin eğitim sırasında öğrendiği çeşitli ağırlıklar ve eğilimlerdir.

Daha fazla bilgi için Makine Öğrenimine Hızlı Bakış Kursu'ndaki Doğrusal regresyon: Hiperparametreler bölümüne bakın.

I

bağımsız ve özdeş dağıtılmış (i.i.d)

#fundamentals

Değişmeyen bir dağılımdan alınan ve alınan her değerin daha önce alınan değerlere bağlı olmadığı veriler. Bağımsız ve aynı dağılıma sahip (i.i.d.) kavramı, makine öğreniminin ideal gazıdır. Bu kavram, faydalı bir matematiksel yapı olsa da gerçek dünyada neredeyse hiçbir zaman tam olarak bulunmaz. Örneğin, bir web sayfasını ziyaret eden kullanıcıların dağılımı kısa bir süre boyunca i.i.d. olabilir. Yani dağılım, bu kısa süre boyunca değişmez ve bir kullanıcının ziyareti genellikle diğer kullanıcının ziyaretinden bağımsızdır. Ancak bu zaman aralığını genişletirseniz web sayfasının ziyaretçilerinde mevsimsel farklılıklar görülebilir.

Ayrıca durağan olmama konusuna da bakın.

çıkarım

#fundamentals

#generativeAI

Geleneksel makine öğreniminde, eğitilmiş bir modelin etiketlenmemiş örneklere uygulanarak tahminlerde bulunma süreci. Daha fazla bilgi edinmek için Makine Öğrenimine Giriş kursundaki Denetimli Öğrenme bölümüne bakın.

Büyük dil modellerinde çıkarım, eğitilmiş bir modeli kullanarak bir giriş istemine yanıt oluşturma sürecidir.

İstatistiklerde çıkarım biraz farklı bir anlama sahiptir. Ayrıntılar için istatistiksel çıkarım hakkındaki Wikipedia makalesine bakın.

giriş katmanı

#fundamentals

Özellik vektörünü tutan nöral ağın katmanı. Yani giriş katmanı, eğitim veya çıkarım için örnekler sağlar. Örneğin, aşağıdaki sinir ağındaki giriş katmanı iki özellikten oluşur:

Dört katman: giriş katmanı, iki gizli katman ve çıkış katmanı.

yorumlanabilirlik

#fundamentals

Bir makine öğrenimi modelinin muhakemesini bir insana anlaşılır bir şekilde açıklama veya sunma becerisi.

Örneğin, çoğu doğrusal regresyon modeli yüksek düzeyde yorumlanabilir. (Her bir özelliğin eğitilmiş ağırlıklarına bakmanız yeterlidir.) Karar ormanları da yüksek oranda yorumlanabilir. Ancak bazı modellerin yorumlanabilmesi için gelişmiş görselleştirmeler gerekir.

ML modellerini yorumlamak için Learning Interpretability Tool'u (LIT) kullanabilirsiniz.

iteration

#fundamentals

Modelin parametrelerinin (modelin ağırlıkları ve eğilimleri) eğitim sırasında tek bir kez güncellenmesi. Toplu iş boyutu, modelin tek bir yinelemede kaç örnek işlediğini belirler. Örneğin, toplu iş boyutu 20 ise model, parametreleri ayarlamadan önce 20 örnek işler.

Nöral ağ eğitirken tek bir yineleme aşağıdaki iki geçişi içerir:

Tek bir toplu işlemdeki kaybı değerlendirmek için iletme geçişi.
Modelin parametrelerini kayba ve öğrenme hızına göre ayarlamak için geriye doğru geçiş (geri yayılım).

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Gradyen inişi bölümüne bakın.

L

L₀ normalleştirmesi

#fundamentals

Bir modeldeki sıfır olmayan ağırlıkların toplam sayısını cezalandıran bir normalleştirme türü. Örneğin, 11 sıfır olmayan ağırlığa sahip bir model, 10 sıfır olmayan ağırlığa sahip benzer bir modelden daha fazla cezalandırılır.

L₀ normalleştirmesi bazen L0 normlu normalleştirme olarak adlandırılır.

Ek notlar için simgeyi tıklayın.

_{L₀ normalleştirmesi, eğitimi dışbükey optimizasyon sorununa dönüştürdüğü için genellikle büyük modellerde pratik değildir.}

L₁ kaybı

#fundamentals

#Metric

Gerçek etiket değerleri ile modelin tahmin ettiği değerler arasındaki farkın mutlak değerini hesaplayan bir kayıp işlevi. Örneğin, beş örnekten oluşan bir toplu işlem için L₁ kaybının hesaplanması aşağıda verilmiştir:

Örneğin gerçek değeri	Modelin tahmini değeri	Delta'nın mutlak değeri
7	6	1
5	4	1
8	11	3
4	6	2
9	8	1
		8 = L₁ kaybı

L₁ kaybı, L₂ kaybına kıyasla aykırı değerlere karşı daha az hassastır.

Ortalama mutlak hata, örnek başına ortalama _L1 kaybıdır.

Resmi matematiksel ifadeyi görmek için simgeyi tıklayın.

$$ L_1 loss = \sum_{i=0}^n | y_i - \hat{y}_i |$$

where:

$n$, örnek sayısıdır.
$y$, etiketin gerçek değeridir.
$\hat{y}$, modelin $y$ için tahmin ettiği değerdir.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Doğrusal Regresyon: Kayıp bölümüne bakın.

L₁ normalleştirmesi

#fundamentals

Ağırlıkların mutlak değerinin toplamıyla orantılı olarak ağırlıklara ceza uygulayan bir normalleştirme türü. L₁ normalleştirme, alakasız veya neredeyse alakasız özelliklerin ağırlıklarını tam olarak 0'a düşürmeye yardımcı olur. Ağırlığı 0 olan bir özellik, modelden etkili bir şekilde kaldırılır.

L₂ normalleştirmesi ile karşılaştırın.

L₂ kaybı

#fundamentals

#Metric

Gerçek etiket değerleri ile modelin tahmin ettiği değerler arasındaki farkın karesini hesaplayan bir kayıp işlevi. Örneğin, beş örnekten oluşan bir toplu işlem için L₂ kaybının hesaplanması aşağıda verilmiştir:

Örneğin gerçek değeri	Modelin tahmini değeri	Delta kare
7	6	1
5	4	1
8	11	9
4	6	4
9	8	1
		16 = L₂ kaybı

Kare alma işlemi nedeniyle L₂ kaybı, aykırı değerlerin etkisini artırır. Yani L₂ kaybı, kötü tahminlere L₁ kaybından daha güçlü tepki verir. Örneğin, önceki toplu iş için L₁ kaybı 16 yerine 8 olur. 16 aykırı değerden 9'unun tek bir aykırı değerden kaynaklandığına dikkat edin.

Regresyon modelleri genellikle kayıp işlevi olarak L₂ kaybını kullanır.

Ortalama Karesel Hata, örnek başına ortalama _L2 kaybıdır. Kare kaybı, L₂ kaybının diğer adıdır.

Resmi matematiksel ifadeyi görmek için simgeyi tıklayın.

$$ L_2 loss = \sum_{i=0}^n {(y_i - \hat{y}_i)}^2$$

where:

$n$, örnek sayısıdır.
$y$, etiketin gerçek değeridir.
$\hat{y}$, modelin $y$ için tahmin ettiği değerdir.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Lojistik regresyon: Kayıp ve düzenlileştirme bölümüne bakın.

L₂ normalleştirme

#fundamentals

Ağırlıkların karelerinin toplamıyla orantılı olarak ağırlıklara oran uygulayan bir normalleştirme türü. L₂ düzenlileştirme, aykırı ağırlıkların (yüksek pozitif veya düşük negatif değerlere sahip olanlar) 0'a daha yakın olmasına yardımcı olur ancak tam olarak 0'a ulaşmaz. Değerleri 0'a çok yakın olan özellikler modelde kalır ancak modelin tahminini çok fazla etkilemez.

L₂ düzenlileştirme, doğrusal modellerde her zaman genelleştirmeyi iyileştirir.

L₁ normalleştirmesi ile karşılaştırın.

Daha fazla bilgi için Makine Öğrenimine Giriş Hızlandırılmış Kursu'ndaki Aşırı Uydurma: L2 düzenlileştirme bölümüne bakın.

etiket

#fundamentals

Denetimli makine öğreniminde, bir örneğin "yanıt" veya "sonuç" kısmı.

Her etiketli örnek, bir veya daha fazla özellikten ve bir etiketten oluşur. Örneğin, bir spam algılama veri kümesinde etiket muhtemelen "spam" veya "spam değil" olur. Bir yağış veri kümesinde etiket, belirli bir dönemde düşen yağmur miktarı olabilir.

Daha fazla bilgi için Makine Öğrenimine Giriş bölümündeki Denetimli Öğrenme başlıklı makaleyi inceleyin.

etiketli örnek

#fundamentals

Bir veya daha fazla özellik ve bir etiket içeren bir örnek. Örneğin, aşağıdaki tabloda bir ev değerleme modelinden alınmış, her biri üç özelliğe ve bir etikete sahip üç etiketli örnek gösterilmektedir:

Yatak odası sayısı	Banyo sayısı	Evin yaşı	Ev fiyatı (etiket)
3	2	15	345.000 ABD doları
2	1	72	$179.000
4	2	34	392.000 ABD doları

Gözetimli makine öğreniminde, modeller etiketli örnekler üzerinde eğitilir ve etiketsiz örnekler üzerinde tahminler yapar.

Etiketli örneği etiketsiz örneklerle karşılaştırın.

Daha fazla bilgi için Makine Öğrenimine Giriş bölümündeki Denetimli Öğrenme başlıklı makaleyi inceleyin.

lambda

#fundamentals

Normalleştirme oranı ile eş anlamlıdır.

Lambda, aşırı yüklenmiş bir terimdir. Burada, terimin normalleştirme kapsamındaki tanımına odaklanıyoruz.

katman

#fundamentals

Nöral ağdaki bir grup nöron. Sık kullanılan üç katman türü şunlardır:

Tüm özellikler için değerler sağlayan giriş katmanı.
Özellikler ile etiket arasındaki doğrusal olmayan ilişkileri bulan bir veya daha fazla gizli katman.
Tahmini sağlayan çıkış katmanı.

Örneğin, aşağıdaki resimde bir giriş katmanı, iki gizli katman ve bir çıkış katmanı olan bir sinir ağı gösterilmektedir:

Bir giriş katmanı, iki gizli katman ve bir çıkış katmanı olan bir sinir ağı. Giriş katmanı iki özellikten oluşur. İlk gizli katman üç nörondan, ikinci gizli katman ise iki nörondan oluşur. Çıkış katmanı tek bir düğümden oluşur.

TensorFlow'da katmanlar, Tensor'ları ve yapılandırma seçeneklerini giriş olarak alan, çıkış olarak da başka tensorlar üreten Python işlevleridir.

öğrenme hızı

#fundamentals

Gradyan inişi algoritmasına her iterasyonda ağırlıkların ve yanlılıkların ne kadar güçlü şekilde ayarlanacağını söyleyen bir kayan noktalı sayıdır. Örneğin, 0,3 öğrenme hızı, ağırlıkları ve yanlılıkları 0,1 öğrenme hızına kıyasla üç kat daha güçlü bir şekilde ayarlar.

Öğrenme hızı önemli bir hiperparametredir. Öğrenme oranını çok düşük ayarlarsanız eğitim çok uzun sürer. Öğrenme oranını çok yüksek ayarlarsanız gradyan inişi genellikle yakınsama noktasına ulaşmakta zorlanır.

Daha matematiksel bir açıklama için simgeyi tıklayın.

Her yineleme sırasında gradyan inişi algoritması, öğrenme hızını gradyanla çarpar. Elde edilen ürüne eğim adımı adı verilir.

Daha fazla bilgi için Makine Öğrenimine Hızlı Bakış Kursu'ndaki Doğrusal regresyon: Hiperparametreler bölümüne bakın.

doğrusal

#fundamentals

Yalnızca toplama ve çarpma işlemleriyle gösterilebilen iki veya daha fazla değişken arasındaki ilişki.

Doğrusal bir ilişkinin grafiği bir doğrudur.

Doğrusal olmayan ile karşılaştırma.

doğrusal model

#fundamentals

Tahmin yapmak için her bir özelliğe bir ağırlık atayan bir model. (Doğrusal modellerde yanlılık da bulunur.) Buna karşılık, derin modellerde özelliklerin tahminlerle ilişkisi genellikle doğrusal değildir.

Doğrusal modellerin eğitimi genellikle daha kolaydır ve derin modellere kıyasla daha yorumlanabilir. Ancak derin modeller, özellikler arasındaki karmaşık ilişkileri öğrenebilir.

Doğrusal regresyon ve lojistik regresyon, iki tür doğrusal modeldir.

Matematik işlemlerini görmek için simgeyi tıklayın.

Doğrusal model şu formülü izler:

$$y' = b + w_1x_1 + w_2x_2 + … w_nx_n$$

where:

y', işlenmemiş tahmindir. (Belirli doğrusal model türlerinde bu ham tahmin daha da değiştirilir. Örneğin, lojistik regresyon bölümüne bakın.)
b, önyargıdır.
w, ağırlık olduğundan w₁ ilk özelliğin ağırlığı, w₂ ikinci özelliğin ağırlığıdır ve bu şekilde devam eder.
x bir özelliktir. Bu nedenle x₁ ilk özelliğin değeri, x₂ ikinci özelliğin değeri vb.dir.

Örneğin, üç özellik için doğrusal bir modelin aşağıdaki sapmayı ve ağırlıkları öğrendiğini varsayalım:

b = 7
w₁ = -2,5
w₂ = -1,2
w₃ = 1.4

Bu nedenle, üç özellik (x₁, x₂ ve x₃) verildiğinde doğrusal model, her tahmini oluşturmak için aşağıdaki denklemi kullanır:

y' = 7 + (-2.5)(x₁) + (-1.2)(x₂) + (1.4)(x₃)

Belirli bir örnekte aşağıdaki değerlerin bulunduğunu varsayalım:

x₁ = 4
x₂ = -10
x₃ = 5

Bu değerleri formüle yerleştirdiğimizde bu örnek için şu tahmin elde edilir:

y' = 7 + (-2.5)(4) + (-1.2)(-10) + (1.4)(5)
y' = 16

Doğrusal modeller yalnızca tahmin yapmak için doğrusal bir denklem kullanan modelleri değil, aynı zamanda tahmin yapan formülün yalnızca bir bileşeni olarak doğrusal bir denklem kullanan daha geniş bir model grubunu da içerir. Örneğin, lojistik regresyon, nihai tahmin değeri olarak 0 ile 1 arasında (1 hariç) bir değer üretmek için ham tahmini (y') sonradan işler.

doğrusal regresyon

#fundamentals

Aşağıdakilerin her ikisinin de geçerli olduğu bir makine öğrenimi modeli türü:

Model, doğrusal bir modeldir.
Tahmin, kayan nokta değeridir. (Bu, doğrusal regresyonun regresyon kısmıdır.)

Doğrusal regresyonu mantıksal regresyonla karşılaştırın. Ayrıca regresyonu sınıflandırma ile karşılaştırın.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Doğrusal regresyon bölümüne bakın.

mantıksal regresyon

#fundamentals

Bir olasılığı tahmin eden bir tür regresyon modeli. Lojistik regresyon modelleri aşağıdaki özelliklere sahiptir:

Etiket kategoriktir. Mantıksal regresyon terimi genellikle ikili mantıksal regresyonu, yani iki olası değere sahip etiketlerin olasılıklarını hesaplayan bir modeli ifade eder. Daha az yaygın bir varyant olan çok terimli lojistik regresyon, ikiden fazla olası değere sahip etiketlerin olasılıklarını hesaplar.
Eğitim sırasında kullanılan kayıp fonksiyonu Log Loss'tur. (İkiden fazla olası değeri olan etiketler için birden fazla Log Loss birimi paralel olarak yerleştirilebilir.)
Model, derin sinir ağı değil, doğrusal bir mimariye sahiptir. Ancak bu tanımın geri kalanı, kategorik etiketlerin olasılıklarını tahmin eden derin modeller için de geçerlidir.

Örneğin, bir giriş e-postasının spam veya spam olmama olasılığını hesaplayan bir lojistik regresyon modelini ele alalım. Çıkarım sırasında modelin 0, 72 tahmin ettiğini varsayalım. Bu nedenle, model şunları tahmin etmektedir:

E-postanın spam olma olasılığı% 72.
E-postanın spam olmama olasılığı% 28.

Lojistik regresyon modeli, aşağıdaki iki adımlı mimariyi kullanır:

Model, giriş özelliklerinin doğrusal bir fonksiyonunu uygulayarak ham bir tahmin (y') oluşturur.
Model, bu ham tahmini sigmoid işlevine girdi olarak kullanır. Bu işlev, ham tahmini 0 ile 1 arasında (0 ve 1 hariç) bir değere dönüştürür.

Herhangi bir regresyon modeli gibi, mantıksal regresyon modeli de bir sayı tahmin eder. Ancak bu sayı genellikle aşağıdaki gibi ikili sınıflandırma modelinin bir parçası haline gelir:

Tahmin edilen sayı sınıflandırma eşiğinden büyükse ikili sınıflandırma modeli pozitif sınıfı tahmin eder.
Tahmin edilen sayı, sınıflandırma eşiğinden küçükse ikili sınıflandırma modeli negatif sınıfı tahmin eder.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Lojistik regresyon bölümüne bakın.

Günlük Kaybı

#fundamentals

İkili mantıksal regresyonda kullanılan kayıp fonksiyonu.

Matematik işlemlerini görmek için simgeyi tıklayın.

Log kaybı aşağıdaki formülle hesaplanır:

$$\text{Log Loss} = \sum_{(x,y)\in D} -y\log(y') - (1 - y)\log(1 - y')$$

where:

$(x,y)\in D$ , $(x,y)$ çiftleri olan birçok etiketli örnek içeren veri kümesidir.
$y$ , etiketli bir örnekteki etikettir. Bu mantıksal regresyon olduğundan, $y$ değerinin her bir öğesi 0 veya 1 olmalıdır.
$y'$ , $x$içindeki özellikler grubu göz önüne alındığında tahmin edilen değerdir (0 ile 1 arasında bir değerdir ancak bu değerler hariçtir).

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Lojistik regresyon: Kayıp ve düzenlileştirme bölümüne bakın.

log-odds

#fundamentals

Bazı olayların olasılık oranının logaritması.

Matematik işlemlerini görmek için simgeyi tıklayın.

Etkinlik ikili olasılıksa bahis oranı, başarı olasılığının (p) başarısızlık olasılığına (1-p) oranıdır. Örneğin, belirli bir etkinliğin %90 başarı ve% 10 başarısızlık olasılığı olduğunu varsayalım. Bu durumda, oran şu şekilde hesaplanır:

$$ {\text{odds}} = \frac{\text{p}} {\text{(1-p)}} = \frac{.9} {.1} = {\text{9}} $$

Log-odds, basitçe odds'un logaritmasıdır. Genel olarak "logaritma" doğal logaritma anlamına gelir ancak logaritma aslında 1'den büyük herhangi bir taban olabilir. Bu nedenle, örneğimizin log-odds'u geleneksel olarak şu şekildedir:

$$ {\text{log-odds}} = ln(9) ~= 2.2 $$

Log-odds işlevi, sigmoid işlevinin tersidir.

mağlubiyet

#fundamentals

#Metric

Gözetimli bir modelin eğitimi sırasında, modelin tahmininin etiketinden ne kadar uzak olduğunu gösteren bir ölçü.

Kayıp işlevi, kaybı hesaplar.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Doğrusal regresyon: Kayıp bölümüne bakın.

kayıp eğrisi

#fundamentals

Eğitim iterasyonlarının sayısının bir fonksiyonu olarak kaybın grafiği. Aşağıdaki grafikte tipik bir kayıp eğrisi gösterilmektedir:

Kayıp ile eğitim yinelemeleri arasındaki ilişkiyi gösteren bir Kartezyen grafik. İlk yinelemelerde kayıpta hızlı bir düşüş, ardından kademeli bir düşüş ve son yinelemelerde düz bir eğim gösterilir.

Kayıp eğrileri, modelinizin ne zaman yakınlaştığını veya aşırı uyum sağladığını belirlemenize yardımcı olabilir.

Kayıp eğrileri, aşağıdaki kayıp türlerinin tümünü çizebilir:

eğitim kaybı
doğrulama kaybı
test kaybı

Ayrıca genelleştirme eğrisini de inceleyin.

Daha fazla bilgi için Makine Öğrenimine Hızlı Bakış kursundaki Aşırı Uydurma: Kayıp eğrilerini yorumlama başlıklı makaleye bakın.

kayıp fonksiyonu

#fundamentals

#Metric

Eğitim veya test sırasında, bir örnek grubu üzerindeki kaybı hesaplayan matematiksel bir işlev. Bir kayıp işlevi, iyi tahminler yapan modeller için kötü tahminler yapan modellere göre daha düşük bir kayıp değeri döndürür.

Eğitimin amacı genellikle bir kayıp işlevinin döndürdüğü kaybı en aza indirmektir.

Birçok farklı türde kayıp fonksiyonu vardır. Oluşturduğunuz model türü için uygun kayıp işlevini seçin. Örneğin:

L₂ kaybı (veya karesi alınmış ortalama hata), doğrusal regresyon için kayıp işlevidir.
Log Loss, lojistik regresyon için kayıp işlevidir.

A

makine öğrenimi

#fundamentals

Giriş verilerinden model eğiten bir program veya sistem. Eğitilmiş model, modeli eğitmek için kullanılan dağıtımla aynı dağıtımdan alınan yeni (daha önce hiç görülmemiş) verilerden yararlı tahminler yapabilir.

Makine öğrenimi, bu programlar veya sistemlerle ilgili çalışma alanını da ifade eder.

Daha fazla bilgi için Makine Öğrenimine Giriş kursuna bakın.

çoğunluk sınıfı

#fundamentals

Sınıf dengesizliği olan bir veri kümesinde daha yaygın olan etiket. Örneğin, %99 negatif etiket ve% 1 pozitif etiket içeren bir veri kümesinde negatif etiketler çoğunluk sınıfıdır.

Azınlık sınıfıyla karşılaştırma.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Veri kümeleri: Dengesiz veri kümeleri bölümüne bakın.

mini toplu iş

#fundamentals

Tek bir iterasyonda işlenen toplu işin küçük ve rastgele seçilmiş bir alt kümesi. Bir mini toplu işin toplu iş boyutu genellikle 10 ile 1.000 örnek arasındadır.

Örneğin, tüm eğitim kümesinin (tam toplu iş) 1.000 örnekten oluştuğunu varsayalım. Ayrıca her mini toplu işin toplu iş boyutunu 20 olarak ayarladığınızı varsayalım. Bu nedenle, her yinelemede 1.000 örnekten rastgele seçilen 20 örnekteki kayıp belirlenir ve ardından ağırlıklar ve önyargılar buna göre ayarlanır.

Kaybı tam toplu işteki tüm örnekler üzerinden hesaplamak yerine mini toplu iş üzerinden hesaplamak çok daha verimlidir.

Daha fazla bilgi için Makine Öğrenimine Hızlı Bakış Kursu'ndaki Doğrusal regresyon: Hiperparametreler bölümüne bakın.

azınlık sınıfı

#fundamentals

Sınıf dengesizliği olan bir veri kümesindeki daha az yaygın etiket. Örneğin, %99 negatif etiket ve% 1 pozitif etiket içeren bir veri kümesinde pozitif etiketler azınlık sınıfıdır.

Çoğunluk sınıfıyla karşılaştırın.

Ek notlar için simgeyi tıklayın.

Bir milyon örnek içeren bir eğitim kümesi etkileyici görünüyor. Ancak azınlık sınıfı iyi temsil edilmiyorsa çok büyük bir eğitim kümesi bile yetersiz kalabilir. Veri kümesindeki toplam örnek sayısına değil, azınlık sınıfındaki örnek sayısına daha fazla odaklanın.

Veri kümeniz yeterli sayıda azınlık sınıfı örneği içermiyorsa azınlık sınıfını desteklemek için alt örnekleme (ikinci madde işaretindeki tanım) kullanmayı düşünebilirsiniz.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Veri kümeleri: Dengesiz veri kümeleri bölümüne bakın.

model

#fundamentals

Genel olarak, giriş verilerini işleyen ve çıkış döndüren tüm matematiksel yapılar. Başka bir deyişle model, bir sistemin tahmin yapması için gereken parametreler ve yapı kümesidir. Gözetimli makine öğreniminde, bir model giriş olarak örnek alır ve çıkış olarak tahmin çıkarır. Gözetimli makine öğreniminde modeller biraz farklılık gösterir. Örneğin:

Doğrusal regresyon modeli, bir dizi ağırlık ve bir önyargıdan oluşur.
Nöral ağ modeli şunlardan oluşur:
- Her biri bir veya daha fazla nöron içeren bir dizi gizli katman.
- Her nöronla ilişkili ağırlıklar ve sapma.
Karar ağacı modeli şunlardan oluşur:
- Ağacın şekli; yani koşulların ve yaprakların bağlanma şekli.
- Koşullar ve izinler

Modelleri kaydedebilir, geri yükleyebilir veya kopyalayabilirsiniz.

Gözetimsiz makine öğrenimi de modeller oluşturur. Bu modeller genellikle bir giriş örneğini en uygun kümeye eşleyebilen bir işlevdir.

Cebirsel ve programlama işlevlerini makine öğrenimi modelleriyle karşılaştırmak için simgeyi tıklayın.

Aşağıdaki gibi bir cebirsel fonksiyon bir modeldir:

  f(x, y) = 3x -5xy + y² + 17

Yukarıdaki işlev, giriş değerlerini (x ve y) çıkışla eşler.

Benzer şekilde, aşağıdaki gibi bir programlama işlevi de bir modeldir:

def half_of_greater(x, y):
  if (x > y):
    return(x / 2)
  else
    return(y / 2)

Arayan, önceki Python işlevine bağımsız değişkenler iletir ve Python işlevi, return ifadesi aracılığıyla çıkış oluşturur.

Derin sinir ağının, cebirsel veya programlama işlevinden çok farklı bir matematiksel yapısı olsa da derin sinir ağı yine de giriş (bir örnek) alır ve çıkış (bir tahmin) döndürür.

Bir programcı, programlama işlevini manuel olarak kodlar. Buna karşılık, makine öğrenimi modeli, otomatik eğitim sırasında optimum parametreleri kademeli olarak öğrenir.

çok sınıflı sınıflandırma

#fundamentals

Denetimli öğrenmede, veri kümesinin ikiden fazla sınıf etiket içerdiği bir sınıflandırma problemi. Örneğin, Iris veri kümesindeki etiketler aşağıdaki üç sınıftan biri olmalıdır:

Iris setosa
Iris virginica
Iris versicolor

Yeni örneklerde Iris türünü tahmin etmek için Iris veri kümesi üzerinde eğitilmiş bir model, çok sınıflı sınıflandırma gerçekleştiriyor.

Buna karşılık, tam olarak iki sınıf arasında ayrım yapan sınıflandırma sorunları ikili sınıflandırma modelleridir. Örneğin, spam veya spam değil olarak tahmin yapan bir e-posta modeli, ikili sınıflandırma modelidir.

Kümeleme sorunlarında çok sınıflı sınıflandırma, ikiden fazla kümeyi ifade eder.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Nöral ağlar: Çok sınıflı sınıflandırma bölümüne bakın.

H

negatif sınıf

#fundamentals

#Metric

İkili sınıflandırmada bir sınıfa pozitif, diğerine ise negatif adı verilir. Pozitif sınıf, modelin test ettiği şey veya etkinliktir. Negatif sınıf ise diğer olasılıktır. Örneğin:

Bir tıbbi testteki negatif sınıf "tümör yok" olabilir.
Bir e-posta sınıflandırma modelindeki negatif sınıf "spam değil" olabilir.

Pozitif sınıfla karşılaştırın.

nöral ağ

#fundamentals

En az bir gizli katman içeren bir model. Derin nöral ağ, birden fazla gizli katman içeren bir nöral ağ türüdür. Örneğin, aşağıdaki şemada iki gizli katman içeren derin bir sinir ağı gösterilmektedir.

Giriş katmanı, iki gizli katmanı ve çıkış katmanı olan bir sinir ağı.

Nöral ağdaki her nöron, bir sonraki katmandaki tüm düğümlere bağlanır. Örneğin, yukarıdaki şemada ilk gizli katmandaki üç nöronun her birinin ikinci gizli katmandaki iki nöronun her ikisine de ayrı ayrı bağlandığını görebilirsiniz.

Bilgisayarlarda uygulanan nöral ağlar, beyinlerde ve diğer sinir sistemlerinde bulunan nöral ağlardan ayırt etmek için bazen yapay nöral ağlar olarak adlandırılır.

Bazı sinir ağları, farklı özellikler ve etiket arasındaki son derece karmaşık doğrusal olmayan ilişkileri taklit edebilir.

Ayrıca evrişimli nöral ağ ve yinelemeli nöral ağ başlıklı makalelere de bakın.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Nöral ağlar bölümüne bakın.

nöron

#fundamentals

Makine öğreniminde, nöral ağın gizli katmanındaki ayrı bir birim. Her nöron aşağıdaki iki adımlı işlemi gerçekleştirir:

Giriş değerlerinin, karşılık gelen ağırlıklarıyla çarpılmış ağırlıklı toplamını hesaplar.
Ağırlıklı toplamı bir etkinleştirme işlevine giriş olarak iletir.

İlk gizli katmandaki bir nöron, giriş katmanındaki özellik değerlerinden girişleri kabul eder. İlk katmanın ötesindeki herhangi bir gizli katmanda bulunan bir nöron, önceki gizli katmandaki nöronlardan girişleri kabul eder. Örneğin, ikinci gizli katmandaki bir nöron, ilk gizli katmandaki nöronlardan giriş kabul eder.

Aşağıdaki resimde iki nöron ve bunların girişleri vurgulanmaktadır.

Giriş katmanı, iki gizli katmanı ve çıkış katmanı olan bir sinir ağı. İki nöron vurgulanır: biri ilk gizli katmanda, diğeri ikinci gizli katmanda. İlk gizli katmandaki vurgulanmış nöron, giriş katmanındaki her iki özellikten de giriş alır. İkinci gizli katmandaki vurgulanmış nöron, ilk gizli katmandaki üç nöronun her birinden giriş alır.

Nöral ağdaki bir nöron, beyinlerdeki ve sinir sistemlerinin diğer kısımlarındaki nöronların davranışını taklit eder.

düğüm (nöral ağ)

#fundamentals

Gizli katmandaki bir nöron.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Nöral Ağlar bölümünü inceleyin.

doğrusal olmayan

#fundamentals

Yalnızca toplama ve çarpma işlemleriyle gösterilemeyen iki veya daha fazla değişken arasındaki ilişki. Doğrusal bir ilişki çizgi olarak gösterilebilir. Doğrusal olmayan bir ilişki çizgi olarak gösterilemez. Örneğin, her biri tek bir özelliği tek bir etiketle ilişkilendiren iki modeli ele alalım. Soldaki model doğrusal, sağdaki model ise doğrusal değildir:

İki arsa. Bir grafik çizgidir, bu nedenle doğrusal bir ilişki söz konusudur.
Diğer grafik bir eğri olduğundan bu doğrusal olmayan bir ilişkidir.

Farklı türde doğrusal olmayan işlevlerle denemeler yapmak için Makine Öğrenimine Giriş Kursu'ndaki Nöral ağlar: Düğümler ve gizli katmanlar bölümüne bakın.

durağan olmama

#fundamentals

Değerleri bir veya daha fazla boyutta (genellikle zaman) değişen bir özellik. Örneğin, aşağıdaki durağan olmama örneklerini inceleyin:

Belirli bir mağazada satılan mayo sayısı mevsime göre değişir.
Belirli bir bölgede hasat edilen belirli bir meyvenin miktarı yılın büyük bir bölümünde sıfır olsa da kısa bir süre boyunca yüksek olabilir.
İklim değişikliği nedeniyle yıllık ortalama sıcaklıklar değişiyor.

Durağanlık ile karşılaştırın.

normalleştirme

#fundamentals

Genel olarak, bir değişkenin gerçek değer aralığını standart bir değer aralığına dönüştürme süreci. Örneğin:

-1 ile +1 arasında
0 ile 1 arasında
Z puanları (kabaca -3 ila +3)

Örneğin, belirli bir özelliğin gerçek değer aralığının 800 ila 2.400 olduğunu varsayalım. Özellik mühendisliği kapsamında, gerçek değerleri -1 ile +1 gibi standart bir aralığa normalleştirebilirsiniz.

Normalleştirme, özellik mühendisliğinde yaygın bir görevdir. Özellik vektöründeki her sayısal özellik yaklaşık olarak aynı aralığa sahip olduğunda modeller genellikle daha hızlı eğitilir (ve daha iyi tahminler üretir).

Ayrıca Z puanı normalleştirme konusuna da bakın.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Sayısal Veriler: Normalleştirme bölümüne bakın.

sayısal veriler

#fundamentals

Tam sayılar veya gerçek değerli sayılar olarak gösterilen özellikler. Örneğin, bir ev değerleme modeli, evin büyüklüğünü (metrekare veya metreküp cinsinden) sayısal veri olarak temsil eder. Bir özelliği sayısal veri olarak temsil etmek, özelliğin değerlerinin etiketle matematiksel bir ilişkisi olduğunu gösterir. Yani bir evdeki metrekare sayısı muhtemelen evin değeriyle matematiksel bir ilişkiye sahiptir.

Tüm tam sayı verileri sayısal veri olarak gösterilmemelidir. Örneğin, dünyanın bazı bölgelerindeki posta kodları tam sayıdır ancak tam sayı posta kodları modellerde sayısal veri olarak gösterilmemelidir. Bunun nedeni, 20000 posta kodunun 10000 posta kodundan iki kat (veya yarısı) daha etkili olmamasıdır. Ayrıca, farklı posta kodları farklı emlak değerleriyle ilişkili olsa da 20000 posta kodundaki emlak değerlerinin 10000 posta kodundaki emlak değerlerinden iki kat daha değerli olduğunu varsayamayız. Posta kodları bunun yerine kategorik veri olarak gösterilmelidir.

Sayısal özelliklere bazen sürekli özellikler de denir.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sayısal verilerle çalışma bölümüne bakın.

O

çevrimdışı

#fundamentals

static kelimesinin eş anlamlısı.

çevrimdışı çıkarım

#fundamentals

Bir modelin toplu tahminler oluşturup bu tahminleri önbelleğe alma (kaydetme) süreci. Böylece uygulamalar, modeli yeniden çalıştırmak yerine önbellekteki çıkarılmış tahmine erişebilir.

Örneğin, dört saatte bir yerel hava durumu tahminleri (öngörüler) oluşturan bir modeli ele alalım. Sistem, her model çalıştırmasından sonra tüm yerel hava durumu tahminlerini önbelleğe alır. Hava durumu uygulamaları, tahminleri önbellekten alır.

Çevrimdışı çıkarıma statik çıkarım da denir.

Online çıkarım ile karşılaştırın. Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Üretim ML sistemleri: Statik ve dinamik çıkarım bölümüne bakın.

one-hot kodlama

#fundamentals

Kategorik verileri aşağıdaki gibi bir vektör olarak temsil etme:

Bir öğe 1 olarak ayarlanır.
Diğer tüm öğeler 0 olarak ayarlanır.

Tek sıcak kodlama, genellikle sınırlı sayıda olası değere sahip dizeleri veya tanımlayıcıları temsil etmek için kullanılır. Örneğin, Scandinavia adlı belirli bir kategorik özelliğin beş olası değeri olduğunu varsayalım:

"Danimarka"
"İsveç"
"Norveç"
"Finland" (Finlandiya)
"İzlanda"

Tek sıcak kodlama, beş değerin her birini aşağıdaki gibi temsil edebilir:

Ülke	Vektör
"Danimarka"	1	0	0	0	0
"İsveç"	0	1	0	0	0
"Norveç"	0	0	1	0	0
"Finland" (Finlandiya)	0	0	0	1	0
"İzlanda"	0	0	0	0	1

Tek seferlik kodlama sayesinde bir model, beş ülkenin her birine göre farklı bağlantılar öğrenebilir.

Bir özelliği sayısal veri olarak temsil etmek, one-hot kodlamaya bir alternatiftir. Maalesef İskandinav ülkelerini sayısal olarak temsil etmek iyi bir seçim değildir. Örneğin, aşağıdaki sayısal gösterimi ele alalım:

"Denmark" is 0
"İsveç" 1
"Norveç" 2
"Finland" is 3
"İzlanda" 4

Sayısal kodlamada model, ham sayıları matematiksel olarak yorumlar ve bu sayılar üzerinde eğitim almaya çalışır. Ancak İzlanda, Norveç'in iki katı (veya yarısı) olmadığından model bazı tuhaf sonuçlara varır.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Kategorik veriler: Sözcük dağarcığı ve tek sıcak kodlama bölümüne bakın.

bire karşı tümü

#fundamentals

N sınıflı bir sınıflandırma sorunu verildiğinde, N ayrı ikili sınıflandırma modelinden oluşan bir çözüm (her olası sonuç için bir ikili sınıflandırma modeli). Örneğin, örnekleri hayvan, bitki veya mineral olarak sınıflandıran bir model verildiğinde, bire karşı tüm çözüm aşağıdaki üç ayrı ikili sınıflandırma modelini sağlar:

hayvan ve hayvan olmayan
sebze ve sebze olmayan
mineral ve mineral olmayan

online

#fundamentals

Dinamik kelimesinin eş anlamlısı.

online çıkarım

#fundamentals

İsteğe bağlı olarak tahminler oluşturma. Örneğin, bir uygulamanın bir modele giriş ilettiğini ve tahmin isteğinde bulunduğunu varsayalım. Online çıkarım kullanan bir sistem, modeli çalıştırarak (ve tahmini uygulamaya döndürerek) isteğe yanıt verir.

Çevrimdışı çıkarım ile karşılaştırın.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Üretim ML sistemleri: Statik ve dinamik çıkarım bölümüne bakın.

çıkış katmanı

#fundamentals

Nöral ağın "son" katmanı. Çıkış katmanı, tahmini içerir.

Aşağıdaki görselde, giriş katmanı, iki gizli katman ve çıkış katmanı olan küçük bir derin sinir ağı gösterilmektedir:

fazla uyumlu

#fundamentals

Modelin, eğitim verileriyle o kadar yakından eşleşmesi ki model, yeni verilerle ilgili doğru tahminler yapamaz.

Düzenlileştirme, aşırı uyumu azaltabilir. Büyük ve çeşitli bir eğitim kümesi üzerinde eğitim yapmak da aşırı uyumu azaltabilir.

Ek notlar için simgeyi tıklayın.

Aşırı uyum, yalnızca en sevdiğiniz öğretmenin tavsiyelerine kesinlikle uymaya benzer. Bu öğretmenin sınıfında başarılı olabilirsiniz ancak öğretmenin fikirlerine "aşırı uyum" sağlayıp diğer sınıflarda başarısız olabilirsiniz. Farklı öğretmenlerin tavsiyelerini dikkate alarak yeni durumlara daha iyi uyum sağlayabilirsiniz.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Aşırı Uydurma bölümüne bakın.

P

pandalar

#fundamentals

numpy üzerine kurulu, sütun odaklı bir veri analizi API'si. TensorFlow da dahil olmak üzere birçok makine öğrenimi çerçevesi, giriş olarak pandas veri yapılarını destekler. Ayrıntılar için pandas belgelerine bakın.

parametresi

#fundamentals

Modelin eğitim sırasında öğrendiği ağırlıklar ve eğilimler. Örneğin, bir doğrusal regresyon modelinde parametreler, aşağıdaki formüldeki sapma (b) ve tüm ağırlıklardan (w₁, w₂ vb.) oluşur:

$$y' = b + w_1x_1 + w_2x_2 + … w_nx_n$$

Buna karşılık, hiperparametreler, sizin (veya bir hiperparametre ayarlama hizmeti) modele sağladığınız değerlerdir. Örneğin, öğrenme oranı bir hiperparametredir.

pozitif sınıf

#fundamentals

#Metric

Test ettiğiniz sınıf.

Örneğin, bir kanser modelindeki pozitif sınıf "tümör" olabilir. Bir e-posta sınıflandırma modelindeki pozitif sınıf "spam" olabilir.

Negatif sınıfla karşılaştırın.

Ek notlar için simgeyi tıklayın.

Birçok testin "pozitif" sonucu genellikle istenmeyen bir sonuç olduğundan pozitif sınıf terimi kafa karıştırıcı olabilir. Örneğin, birçok tıbbi testte pozitif sınıf, tümörlere veya hastalıklara karşılık gelir. Genel olarak, doktorun size "Tebrikler! Test sonuçlarınız negatif çıktı." Bununla birlikte, pozitif sınıf, testin bulmaya çalıştığı etkinliktir.

Açıkçası, hem pozitif hem de negatif sınıflar için aynı anda test yapıyorsunuz.

işleme sonrası

#responsible

#fundamentals

Model çalıştırıldıktan sonra modelin çıktısını ayarlama. Modellerin kendilerini değiştirmeden adalet kısıtlamalarını zorunlu kılmak için sonradan işleme kullanılabilir.

Örneğin, bir kullanıcı ikili sınıflandırma modeline bir sınıflandırma eşiği belirleyerek sonradan işleme uygulayabilir. Bu sayede, gerçek pozitif oranının söz konusu özelliğin tüm değerleri için aynı olduğu kontrol edilerek bazı özellikler için fırsat eşitliği korunur.

precision

#fundamentals

#Metric

Aşağıdaki soruyu yanıtlayan sınıflandırma modelleri için bir metrik:

Model pozitif sınıfı tahmin ettiğinde tahminlerin yüzde kaçı doğruydu?

Formül şu şekildedir:

$$\text{Precision} = \frac{\text{true positives}} {\text{true positives} + \text{false positives}}$$

Bu örnekte:

Gerçek pozitif, modelin pozitif sınıfı doğru tahmin ettiği anlamına gelir.
Yanlış pozitif, modelin pozitif sınıfı yanlışlıkla tahmin ettiği anlamına gelir.

Örneğin, bir modelin 200 pozitif tahminde bulunduğunu varsayalım. Bu 200 pozitif tahminden:

150'si gerçek pozitifti.
50'si yanlış pozitifti.

Bu durumda:

$$\text{Precision} = \frac{\text{150}} {\text{150} + \text{50}} = 0.75$$

Doğruluk ve geri çağırma ile karşılaştırın.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Sınıflandırma: Doğruluk, geri çağırma, hassasiyet ve ilgili metrikler bölümüne bakın.

tahmin

#fundamentals

Modelin çıktısı. Örneğin:

İkili sınıflandırma modelinin tahmini, pozitif sınıf veya negatif sınıftır.
Çok sınıflı sınıflandırma modelinin tahmini tek bir sınıftır.
Doğrusal regresyon modelinin tahmini bir sayıdır.

proxy etiketleri

#fundamentals

Etiketleri tahmin etmek için kullanılan veriler, bir veri kümesinde doğrudan kullanılamaz.

Örneğin, çalışanların stres düzeyini tahmin etmek için bir modeli eğitmeniz gerektiğini varsayalım. Veri kümeniz çok sayıda tahmini özellik içeriyor ancak stres seviyesi adlı bir etiket içermiyor. Pes etmeyip stres seviyesi için proxy etiket olarak "iş kazaları"nı seçiyorsunuz. Sonuçta, yüksek stres altındaki çalışanlar sakin çalışanlara göre daha fazla kaza yapar. Yoksa öyle mi? Belki de iş kazaları aslında birden fazla nedenden dolayı artıp azalıyor.

İkinci bir örnek olarak, veri kümeniz için yağmur yağıyor mu? ifadesinin Boole etiketi olmasını istediğinizi ancak veri kümenizde yağmur verilerinin olmadığını varsayalım. Fotoğraflar varsa şemsiye taşıyan kişilerin resimlerini Yağmur yağıyor mu? için proxy etiketi olarak belirleyebilirsiniz. Bu iyi bir vekil etiketi mi? Olabilir ancak bazı kültürlerde insanlar yağmurdan ziyade güneşten korunmak için şemsiye taşıyor olabilir.

Proxy etiketleri genellikle kusurludur. Mümkün olduğunda, proxy etiketler yerine gerçek etiketleri seçin. Bununla birlikte, gerçek bir etiket olmadığında en az kötü olan vekil etiket adayını seçerek vekil etiketi çok dikkatli bir şekilde belirleyin.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Veri Kümeleri: Etiketler bölümüne bakın.

R

RAG

#fundamentals

Almayla artırılmış üretim ifadesinin kısaltmasıdır.

puan veren kullanıcı

#fundamentals

Örnekler için etiketler sağlayan kişi. "Açıklama Ekleyen", değerlendiricinin diğer adıdır.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Kategorik veriler: Yaygın sorunlar başlıklı makaleyi inceleyin.

hatırlanabilirlik

#fundamentals

#Metric

Aşağıdaki soruyu yanıtlayan sınıflandırma modelleri için bir metrik:

Kesin referans pozitif sınıf olduğunda model, tahminlerin yüzde kaçını doğru şekilde pozitif sınıf olarak tanımladı?

Formül şu şekildedir:

\[\text{Recall} = \frac{\text{true positives}} {\text{true positives} + \text{false negatives}} \]

Bu örnekte:

Gerçek pozitif, modelin pozitif sınıfı doğru tahmin ettiği anlamına gelir.
Yanlış negatif, modelin yanlışlıkla negatif sınıfı tahmin ettiği anlamına gelir.

Örneğin, modelinizin kesin referansın pozitif sınıf olduğu örnekler üzerinde 200 tahmin yaptığını varsayalım. Bu 200 tahminden:

180'i doğru pozitifti.
20'si yanlış negatifti.

Bu durumda:

\[\text{Recall} = \frac{\text{180}} {\text{180} + \text{20}} = 0.9 \]

Sınıf dengesizliği olan veri kümeleriyle ilgili notlar için simgeyi tıklayın.

Geri çağırma, özellikle pozitif sınıfın nadir olduğu sınıflandırma modellerinin tahmin gücünü belirlemek için kullanışlıdır. Örneğin, belirli bir hastalığın pozitif sınıfının bir milyon hastadan yalnızca 10'unda görüldüğü bir sınıf dengesizliği olan veri kümesini ele alalım. Modelinizin, aşağıdaki sonuçları veren beş milyon tahmin yaptığını varsayalım:

30 Gerçek Pozitif
20 Yanlış Negatif
4.999.000 Gerçek Negatif
950 yanlış pozitif

Bu modelin geri çağırma işlemi şu şekilde yapılır:

recall = TP / (TP + FN)
recall = 30 / (30 + 20) = 0.6 = 60%

Buna karşılık, bu modelin doğruluğu:

accuracy = (TP + TN) / (TP + TN + FP + FN)
accuracy = (30 + 4,999,000) / (30 + 4,999,000 + 950 + 20) = 99.98%

Bu yüksek doğruluk değeri etkileyici görünse de aslında anlamsızdır. Geri çağırma, sınıf dengesizliği olan veri kümeleri için doğruluktan çok daha kullanışlı bir metriktir.

Daha fazla bilgi için Sınıflandırma: Doğruluk, geri çağırma, hassasiyet ve ilgili metrikler başlıklı makaleyi inceleyin.

Düzeltilmiş Doğrusal Birim (ReLU)

#fundamentals

Aşağıdaki davranışa sahip bir etkinleştirme işlevi:

Giriş negatif veya sıfırsa çıkış 0 olur.
Giriş pozitifse çıkış girişe eşittir.

Örneğin:

Giriş -3 ise çıkış 0 olur.
Giriş +3 ise çıkış 3, 0 olur.

ReLU grafiği:

ReLU, çok popüler bir etkinleştirme işlevidir. Basit davranışına rağmen ReLU, sinir ağının doğrusal olmayan ilişkileri özellikler ile etiket arasında öğrenmesini sağlar.

regresyon modeli

#fundamentals

Gayri resmi olarak, sayısal tahmin oluşturan bir model. (Buna karşılık, sınıflandırma modeli bir sınıf tahmini oluşturur.) Örneğin, aşağıdakilerin tümü regresyon modelidir:

Belirli bir evin değerini euro cinsinden (ör. 423.000) tahmin eden bir model.
Belirli bir ağacın ortalama yaşam süresini yıllar içinde tahmin eden bir model (ör.23,2).
Belirli bir şehirde önümüzdeki altı saat içinde düşecek yağmur miktarını inç cinsinden tahmin eden bir model (ör.0, 18).

Sık kullanılan iki tür regresyon modeli şunlardır:

Etiket değerlerini özelliklere en iyi şekilde uyduran çizgiyi bulan doğrusal regresyon.
Lojistik regresyon: 0,0 ile 1,0 arasında bir olasılık oluşturur. Bu olasılık, sistem tarafından genellikle bir sınıf tahminiyle eşlenir.

Sayısal tahminler veren her model bir regresyon modeli değildir. Bazı durumlarda sayısal tahmin, sayısal sınıf adlarına sahip bir sınıflandırma modelidir. Örneğin, sayısal bir posta kodunu tahmin eden model regresyon modeli değil, sınıflandırma modelidir.

normalleştirme

#fundamentals

Aşırı uyumu azaltan tüm mekanizmalar. Popüler düzenlileştirme türleri şunlardır:

L₁ normalleştirme
L₂ düzenlileştirme
dropout regularization
erken durdurma (Bu, resmi bir düzenlileştirme yöntemi olmasa da aşırı uyumu etkili bir şekilde sınırlayabilir.)

Düzenlileştirme, bir modelin karmaşıklığına uygulanan ceza olarak da tanımlanabilir.

Ek notlar için simgeyi tıklayın.

Normalleştirme, sezgisel değildir. Düzenlileştirmenin artırılması genellikle eğitim kaybını artırır. Bu durum kafa karıştırıcıdır çünkü eğitim kaybını en aza indirmek amaçlanmaz mı?

Aslında hayır. Amaç, eğitim kaybını en aza indirmek değildir. Amaç, gerçek hayattaki örnekler hakkında mükemmel tahminler yapmaktır. Düzenlileştirmenin artırılması eğitim kaybını artırsa da genellikle modellerin gerçek hayattaki örnekler üzerinde daha iyi tahminler yapmasına yardımcı olur.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Aşırı Uydurma: Model karmaşıklığı bölümüne bakın.

normalleştirme oranı

#fundamentals

Eğitim sırasında düzenlileştirmenin göreli önemini belirten bir sayı. Düzenlileştirme oranını artırmak aşırı uyumu azaltır ancak modelin tahmin gücünü düşürebilir. Bunun tersine, düzenlileştirme oranının azaltılması veya atlanması aşırı uyumu artırır.

Matematik işlemlerini görmek için simgeyi tıklayın.

Düzenlileştirme oranı genellikle Yunan harfi lambda ile gösterilir. Aşağıdaki basitleştirilmiş kayıp denklemi, lambda'nın etkisini gösterir:

$$\text{minimize(loss function + }\lambda\text{(regularization))}$$

Burada düzenlileştirme, aşağıdakiler dahil olmak üzere herhangi bir düzenlileştirme mekanizmasıdır:

L₁ normalleştirme
L₂ düzenlileştirme

Daha fazla bilgi için Makine Öğrenimine Giriş Hızlandırılmış Kursu'ndaki Aşırı Uydurma: L2 düzenlileştirme bölümüne bakın.

ReLU

#fundamentals

Rectified Linear Unit'in kısaltmasıdır.

veriyle artırılmış üretim (RAG)

#fundamentals

Büyük dil modeli (LLM) çıkışının kalitesini, model eğitildikten sonra alınan bilgi kaynaklarıyla temellendirerek iyileştirmeye yönelik bir teknik. RAG, eğitilmiş LLM'ye güvenilir bilgi tabanlarından veya dokümanlardan alınan bilgilere erişim sağlayarak LLM yanıtlarının doğruluğunu artırır.

Almayla artırılmış üretimi kullanmanın yaygın nedenleri şunlardır:

Modelin oluşturduğu yanıtların olgusal doğruluğunu artırma
Modele, eğitilmediği bilgilere erişim izni verme
Modelin kullandığı bilgileri değiştirme
Modelin kaynakları alıntılamasını sağlama

Örneğin, bir kimya uygulamasının kullanıcı sorgularıyla ilgili özetler oluşturmak için PaLM API'yi kullandığını varsayalım. Uygulamanın arka ucu bir sorgu aldığında arka uç:

Kullanıcının sorgusuyla alakalı verileri arar ("alır").
İlgili kimya verilerini kullanıcının sorgusuna ekler ("artırır").
LLM'ye, eklenen verilere dayalı bir özet oluşturması talimatı verilir.

ROC (alıcı çalışma özelliği) eğrisi

#fundamentals

#Metric

İkili sınıflandırmada farklı sınıflandırma eşikleri için gerçek pozitif oranı ile yanlış pozitif oranı arasındaki ilişkiyi gösteren grafik.

ROC eğrisinin şekli, ikili sınıflandırma modelinin pozitif sınıfları negatif sınıflardan ayırma yeteneğini gösterir. Örneğin, ikili sınıflandırma modelinin tüm negatif sınıfları tüm pozitif sınıflardan mükemmel şekilde ayırdığını varsayalım:

Sağ tarafta 8 pozitif örnek ve sol tarafta 7 negatif örnek içeren bir sayı doğrusu.

Önceki modelin ROC eğrisi aşağıdaki gibi görünür:

ROC eğrisi. X ekseni yanlış pozitif oranı, y ekseni ise doğru pozitif oranıdır. Eğri, ters L şeklindedir. Eğri, (0.0,0.0) noktasından başlar ve (0.0,1.0) noktasına kadar düz bir şekilde yükselir. Ardından eğri (0,0,1,0) değerinden (1,0,1,0) değerine gider.

Buna karşılık, aşağıdaki resimde, negatif sınıfları pozitif sınıflardan hiç ayıramayan kötü bir modelin ham lojistik regresyon değerleri grafik olarak gösterilmektedir:

Pozitif örnekler ve negatif sınıfların tamamen karıştığı bir sayı doğrusu.

Bu modelin ROC eğrisi aşağıdaki gibi görünür:

(0.0,0.0) ile (1.0,1.0) arasında düz bir çizgi olan ROC eğrisi.

Bu arada, gerçek hayatta çoğu ikili sınıflandırma modeli pozitif ve negatif sınıfları bir dereceye kadar ayırır ancak genellikle mükemmel bir şekilde değil. Bu nedenle, tipik bir ROC eğrisi iki uç nokta arasında bir yerde bulunur:

ROC eğrisi. X ekseni yanlış pozitif oranı, y ekseni ise doğru pozitif oranıdır. ROC eğrisi, pusula noktalarını batıdan kuzeye doğru geçen titrek bir yayı yaklaşık olarak gösterir.

Bir ROC eğrisinde (0.0,1.0) noktasına en yakın olan nokta, teorik olarak ideal sınıflandırma eşiğini tanımlar. Ancak ideal sınıflandırma eşiğinin seçilmesini etkileyen başka gerçek dünya sorunları da vardır. Örneğin, yanlış negatif sonuçlar, yanlış pozitif sonuçlardan çok daha fazla sorun yaratabilir.

AUC adı verilen sayısal bir metrik, ROC eğrisini tek bir kayan nokta değeriyle özetler.

Kök Ortalama Kare Hatası (RMSE)

#fundamentals

#Metric

Ortalama karesel hatanın karekökü.

G

sigmoid işlevi

#fundamentals

Bir giriş değerini sınırlı bir aralığa (genellikle 0 ile 1 veya -1 ile +1) "sıkıştıran" matematiksel bir işlev. Yani, bir sigmoid fonksiyonuna herhangi bir sayı (iki, bir milyon, eksi bir milyar vb.) iletebilirsiniz ve çıkış yine de sınırlı aralıkta olur. Sigmoid aktivasyon fonksiyonunun grafiği şu şekilde görünür:

Sigmoid işlevinin makine öğreniminde çeşitli kullanım alanları vardır. Örneğin:

Mantıksal regresyon veya çok terimli regresyon modelinin ham çıktısını olasılığa dönüştürme.
Bazı sinir ağlarında etkinleştirme işlevi olarak çalışır.

Matematik işlemlerini görmek için simgeyi tıklayın.

Bir giriş sayısı x üzerindeki sigmoid işlevi aşağıdaki formüle sahiptir:

$$ sigmoid(x) = \frac{1}{1 + e^{-\text{x}}} $$

Makine öğreniminde x genellikle ağırlıklı bir toplamdır.

softmax

#fundamentals

Çok sınıflı sınıflandırma modelinde olası her sınıf için olasılıkları belirleyen bir işlev. Olasılıkların toplamı tam olarak 1,0'dır. Örneğin, aşağıdaki tabloda softmax'ın çeşitli olasılıkları nasıl dağıttığı gösterilmektedir:

Resim bir...	Probability
köpek	0,85
Cat	0,13
at	0,02

Softmax, tam softmax olarak da adlandırılır.

Aday örnekleme ile karşılaştırın.

Matematik işlemlerini görmek için simgeyi tıklayın.

Softmax denklemi şu şekildedir:

$$\sigma_i = \frac{e^{\text{z}_i}} {\sum_{j=1}^{j=K} {e^{\text{z}_j}}} $$

where:

$\sigma_i$ çıkış vektörüdür. Çıkış vektörünün her öğesi, bu öğenin olasılığını belirtir. Çıkış vektöründeki tüm öğelerin toplamı 1,0'dır. Çıkış vektörü, giriş vektörü $z$ ile aynı sayıda öğe içerir.
$z$ giriş vektörüdür. Giriş vektörünün her öğesi kayan nokta değeri içerir.
$K$, giriş vektöründeki (ve çıkış vektöründeki) öğe sayısıdır.

Örneğin, giriş vektörünün şu olduğunu varsayalım:

[1.2, 2.5, 1.8]

Bu nedenle, softmax, paydayı aşağıdaki şekilde hesaplar:

$$\text{denominator} = e^{1.2} + e^{2.5} + e^{1.8} = 21.552$$

Bu nedenle, her öğenin softmax olasılığı şöyledir:

$$\sigma_1 = \frac{e^{1.2}}{21.552} = 0.154 $$ $$\sigma_2 = \frac{e^{2.5}}{21.552} = 0.565 $$ $$\sigma_1 = \frac{e^{1.8}}{21.552} = 0.281 $$

Bu nedenle çıkış vektörü şöyledir:

$$\sigma = [0.154, 0.565, 0.281]$$

$\sigma$ içindeki üç öğenin toplamı 1,0'dır. Bora

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Nöral ağlar: Çok sınıflı sınıflandırma bölümüne bakın.

seyrek özellik

#fundamentals

Değerleri çoğunlukla sıfır veya boş olan bir özellik. Örneğin, tek bir 1 değeri ve bir milyon 0 değeri içeren bir özellik seyrek olur. Buna karşılık, yoğun bir özellik, çoğunlukla sıfır veya boş olmayan değerlere sahiptir.

Makine öğreniminde, şaşırtıcı sayıda özellik seyrek özelliklerdir. Kategorik özellikler genellikle seyrek özelliklerdir. Örneğin, bir ormanda olabilecek 300 ağaç türünden tek bir örnek yalnızca akçaağaç olarak tanımlanabilir. Alternatif olarak, bir video kitaplığındaki milyonlarca olası videodan tek bir örnek yalnızca "Casablanca"yı tanımlayabilir.

Bir modelde, seyrek özellikleri genellikle one-hot kodlama ile temsil edersiniz. One-hot kodlama büyükse daha fazla verimlilik için one-hot kodlamanın üzerine bir yerleştirme katmanı koyabilirsiniz.

seyrek gösterim

#fundamentals

Seyrek bir özellikte yalnızca sıfır olmayan öğelerin konumlarını saklama.

Örneğin, species adlı kategorik bir özelliğin belirli bir ormandaki 36 ağaç türünü tanımladığını varsayalım. Ayrıca her örneğin yalnızca tek bir türü tanımladığını varsayalım.

Her örnekteki ağaç türünü göstermek için tek sıcaklık vektörü kullanabilirsiniz. Tek sıcaklık vektöründe tek bir 1 (örnekteki belirli ağaç türünü temsil etmek için) ve 35 0 (örnekteki 35 ağaç türünü temsil etmemek için) bulunur. Bu nedenle, maple öğesinin tek sıcaklık gösterimi aşağıdaki gibi olabilir:

0-23 arasındaki konumların 0 değerini, 24. konumun 1 değerini ve 25-35 arasındaki konumların 0 değerini tuttuğu bir vektör.

Alternatif olarak, seyrek gösterim yalnızca belirli türlerin konumunu tanımlar. maple 24. konumdaysa maple öğesinin seyrek gösterimi şu şekilde olur:

Seyrek gösterimin, tek sıcak gösterimden çok daha kompakt olduğuna dikkat edin.

Biraz daha karmaşık bir örnek için simgeyi tıklayın.

Modelinizdeki her örneğin, İngilizce bir cümledeki kelimeleri (ancak bu kelimelerin sırasını değil) temsil etmesi gerektiğini varsayalım. İngilizce yaklaşık 170.000 kelimeden oluşur. Bu nedenle İngilizce, yaklaşık 170.000 öğeli kategorik bir özelliktir. İngilizce cümlelerin çoğunda bu 170.000 kelimenin çok küçük bir kısmı kullanılır. Bu nedenle, tek bir örnekteki kelime grubu neredeyse kesinlikle seyrek veriler olacaktır.

Aşağıdaki cümleyi ele alalım:

My dog is a great dog

Bu cümledeki kelimeleri temsil etmek için one-hot vektörün bir varyantını kullanabilirsiniz. Bu varyantta, vektördeki birden fazla hücre sıfır olmayan bir değer içerebilir. Ayrıca bu varyantta bir hücre, birden farklı bir tam sayı içerebilir. "Benim", "bir", "harika" ve "köpeğim" kelimeleri cümlede yalnızca bir kez geçse de "köpek" kelimesi iki kez geçiyor. Bu cümlede yer alan kelimeleri temsil etmek için tek sıcak vektörlerin bu varyantını kullandığımızda 170.000 öğeli aşağıdaki vektör elde edilir:

Aynı cümlenin seyrek gösterimi şu şekilde olur:

Kafanız karıştığında simgeyi tıklayın.

"Seyrek gösterim" terimi, seyrek gösterimin kendisi seyrek bir vektör olmadığı için birçok kişiyi şaşırtır. Daha doğrusu, seyrek gösterim aslında seyrek bir vektörün yoğun gösterimidir. Dizin gösterimi eş anlamlısı, "seyrek gösterim"den biraz daha anlaşılırdır.

Daha fazla bilgi için Makine Öğrenimine Giriş Kursu'ndaki Kategorik verilerle çalışma bölümüne bakın.

seyrek vektör

#fundamentals

Değerleri çoğunlukla sıfır olan bir vektör. Ayrıca sparse feature ve sparsity konularına da bakın.

kare kaybı

#fundamentals

#Metric

L₂ kaybı ile eş anlamlıdır.

statik

#fundamentals

Sürekli değil, bir kez yapılan bir şey. Statik ve çevrimdışı terimleri eş anlamlıdır. Aşağıda, makine öğreniminde statik ve çevrimdışı kullanımına dair yaygın örnekler verilmiştir:

Statik model (veya çevrimdışı model), bir kez eğitilen ve bir süre kullanılan modeldir.
Statik eğitim (veya çevrimdışı eğitim), statik bir modeli eğitme sürecidir.
Statik çıkarım (veya çevrimdışı çıkarım), bir modelin tek seferde bir grup tahmin oluşturduğu bir süreçtir.

Dinamik ile karşılaştırma

statik çıkarım

#fundamentals

Çevrimdışı çıkarım ile eş anlamlıdır.

durağanlık

#fundamentals

Değerleri bir veya daha fazla boyutta (genellikle zaman) değişmeyen bir özellik. Örneğin, değerleri 2021 ve 2023'te yaklaşık olarak aynı görünen bir özellik durağanlık gösterir.

Gerçek dünyada çok az özellik durağanlık gösterir. Kararlılıkla eş anlamlı olan özellikler (ör. deniz seviyesi) bile zaman içinde değişir.

Durağansızlık ile karşılaştırın.

stokastik gradyan inişi (SGD)

#fundamentals

Toplu iş boyutunun bir olduğu gradyan inişi algoritması. Diğer bir deyişle SGD, eğitim setinden rastgele ve eşit şekilde seçilen tek bir örnek üzerinde eğitilir.

Daha fazla bilgi için Machine Learning Crash Course'taki Doğrusal regresyon: Hiperparametreler başlıklı makaleyi inceleyin.

denetimli makine öğrenmesi

#fundamentals

Özelliklerden ve bunlara karşılık gelen etiketlerden model eğitimi. Denetimli makine öğrenimi, bir dizi soruyu ve ilgili cevaplarını inceleyerek bir konuyu öğrenmeye benzer. Sorular ve cevaplar arasındaki eşlemeyi öğrendikten sonra, öğrenci aynı konuyla ilgili yeni (daha önce hiç görülmemiş) soruları cevaplayabilir.

Denetimsiz makine öğrenimi ile karşılaştırın.

Daha fazla bilgi için Makine Öğrenimine Giriş kursundaki Gözetimli Öğrenme bölümüne bakın.

yapay özellik

#fundamentals

Giriş özellikleri arasında bulunmayan ancak bir veya daha fazla giriş özelliğinden oluşturulan bir özellik. Yapay özellikler oluşturma yöntemleri şunlardır:

Sürekli bir özelliği aralık gruplarına gruplandırma.
Çapraz özellik oluşturma.
Bir özellik değerini diğer özellik değerleriyle veya kendisiyle çarpma (ya da bölme). Örneğin, a ve b giriş özellikleri ise aşağıdaki özellikler sentetik özellik örnekleridir:
- ab
- a²
Bir özellik değerine aşkın fonksiyon uygulama. Örneğin, c bir giriş özelliği ise aşağıdaki özellikler sentetik özellik örnekleridir:
- sin(c)
- ln(c)

Yalnızca normalleştirme veya ölçeklendirme ile oluşturulan özellikler, sentetik özellik olarak kabul edilmez.

T

test kaybı

#fundamentals

#Metric

Bir modelin test kümesine karşı kaybını temsil eden bir metrik. Model oluştururken genellikle test kaybını en aza indirmeye çalışırsınız. Bunun nedeni, düşük test kaybının düşük eğitim kaybı veya düşük doğrulama kaybından daha güçlü bir kalite sinyali olmasıdır.

Test kaybı ile eğitim kaybı veya doğrulama kaybı arasında büyük bir fark olması bazen düzenlileştirme oranını artırmanız gerektiğini gösterir.

eğitim

#fundamentals

Model oluşturan ideal parametrelerin (ağırlıklar ve önyargılar) belirlenmesi süreci. Eğitim sırasında sistem, örnekleri okur ve parametreleri kademeli olarak ayarlar. Eğitimde her örnek birkaç kezden milyarlarca kez kullanılabilir.

Daha fazla bilgi için Makine Öğrenimine Giriş kursundaki Gözetimli Öğrenme bölümüne bakın.

eğitim kaybı

#fundamentals

#Metric

Belirli bir eğitim yinelemesi sırasında modelin kaybını temsil eden bir metrik. Örneğin, kayıp işlevinin ortalama kare hatası olduğunu varsayalım. Örneğin, 10.yinelemede eğitim kaybı (ortalama kare hatası) 2,2 ve 100.yinelemede eğitim kaybı 1,9 olabilir.

Kayıp eğrisi, eğitim kaybını yineleme sayısına karşı çizer. Bir kayıp eğrisi, eğitimle ilgili aşağıdaki ipuçlarını sağlar:

Aşağı doğru eğim, modelin iyileştiğini gösterir.
Yukarı doğru eğim, modelin kötüleştiğini gösterir.
Düz bir eğim, modelin yakınsama noktasına ulaştığını gösterir.

Örneğin, aşağıdaki biraz idealize edilmiş kayıp eğrisi şunları gösterir:

İlk yinelemeler sırasında hızlı model iyileştirmesini ifade eden dik bir aşağı eğim.
Eğitim sona erene kadar kademeli olarak düzleşen (ancak yine de aşağı doğru) bir eğim. Bu, ilk yinelemelerdeki hızdan biraz daha yavaş bir hızda modelin iyileşmeye devam ettiğini gösterir.
Eğitimin sonuna doğru düz bir eğim, yakınsama olduğunu gösterir.

Eğitim kaybının yinelemelere karşı grafiği. Bu kayıp eğrisi, dik bir aşağı eğimle başlar. Eğim, sıfır olana kadar kademeli olarak düzleşir.

Eğitim kaybı önemli olsa da genelleme konusuna da göz atın.

eğitim ve sunma arası sapma

#fundamentals

Bir modelin eğitim sırasındaki performansı ile aynı modelin sunma sırasındaki performansı arasındaki fark.

eğitim seti

#fundamentals

Veri kümesinin bir modeli eğitmek için kullanılan alt kümesi.

Geleneksel olarak, veri kümesindeki örnekler aşağıdaki üç farklı alt kümeye ayrılır:

eğitim seti
Doğrulama kümesi
test grubu

İdeal olarak, veri kümesindeki her örnek yalnızca yukarıdaki alt kümelerden birine ait olmalıdır. Örneğin, tek bir örnek hem eğitim kümesine hem de doğrulama kümesine ait olmamalıdır.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Veri kümeleri: Orijinal veri kümesini bölme başlıklı makaleyi inceleyin.

doğru negatif (TN)

#fundamentals

#Metric

Modelin negatif sınıfı doğru şekilde tahmin ettiği bir örnek. Örneğin, model belirli bir e-posta iletisinin spam olmadığını çıkarır ve bu e-posta iletisi gerçekten spam değildir.

Gerçek pozitif (TP)

#fundamentals

#Metric

Modelin pozitif sınıfı doğru tahmin ettiği bir örnek. Örneğin, model belirli bir e-posta iletisinin spam olduğunu çıkarımlıyor ve bu e-posta iletisi gerçekten spam oluyor.

Gerçek pozitif oranı (TPR)

#fundamentals

#Metric

Geri çağırma ile eş anlamlıdır. Yani:

$$\text{true positive rate} = \frac {\text{true positives}} {\text{true positives} + \text{false negatives}}$$

Gerçek pozitif oranı, ROC eğrisindeki y eksenidir.

U

eksik uyum

#fundamentals

Model, eğitim verilerinin karmaşıklığını tam olarak yakalamadığı için zayıf tahmin yeteneğine sahip bir model oluşturma. Aşağıdakiler de dahil olmak üzere birçok sorun, eksik uyuma neden olabilir:

Yanlış özellikler kümesiyle eğitim.
Çok az dönem için veya çok düşük bir öğrenme hızıyla eğitim.
Çok yüksek bir düzenlileştirme oranıyla eğitim.
Derin bir nöral ağda çok az gizli katman sağlamak.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Aşırı Uydurma bölümüne bakın.

etiketsiz örnek

#fundamentals

Özellik içeren ancak etiket içermeyen bir örnek. Örneğin, aşağıdaki tabloda bir ev değerleme modelinden alınan üç etiketsiz örnek gösterilmektedir. Bu örneklerin her birinde üç özellik vardır ancak ev değeri yoktur:

Yatak odası sayısı	Banyo sayısı	Evin yaşı
3	2	15
2	1	72
4	2	34

Gözetimli makine öğreniminde, modeller etiketli örnekler üzerinde eğitilir ve etiketsiz örnekler üzerinde tahminler yapar.

Yarı gözetimli ve denetimsiz öğrenmede eğitim sırasında etiketsiz örnekler kullanılır.

Etiketsiz örneği etiketli örnekle karşılaştırın.

denetimsiz makine öğrenmesi

#clustering

#fundamentals

Bir veri kümesindeki (genellikle etiketlenmemiş bir veri kümesi) kalıpları bulmak için model eğitme.

Gözetimsiz makine öğreniminin en yaygın kullanım şekli, verileri benzer örnekler grupları halinde kümelemektir. Örneğin, gözetimsiz bir makine öğrenimi algoritması, şarkıları müziğin çeşitli özelliklerine göre gruplandırabilir. Elde edilen kümeler, diğer makine öğrenimi algoritmalarına (ör. müzik önerisi hizmeti) giriş olarak kullanılabilir. Kümeleme, faydalı etiketlerin az olduğu veya hiç olmadığı durumlarda yardımcı olabilir. Örneğin, kötüye kullanım ve sahtekarlıkla mücadele gibi alanlarda kümeler, insanların verileri daha iyi anlamasına yardımcı olabilir.

Denetimli makine öğrenimi ile karşılaştırın.

Ek notlar için simgeyi tıklayın.

Denetimsiz makine öğrenimine bir başka örnek de ana bileşenler analizidir (PCA). Örneğin, milyonlarca alışveriş sepetinin içeriğini içeren bir veri kümesine PCA uygulamak, limon içeren alışveriş sepetlerinde genellikle antasitlerin de bulunduğunu ortaya çıkarabilir.

Daha fazla bilgi için Makine Öğrenimine Giriş kursundaki Makine öğrenimi nedir? başlıklı makaleyi inceleyin.

V

doğrulama

#fundamentals

Bir modelin kalitesinin ilk değerlendirmesi. Doğrulama, bir modelin tahminlerinin kalitesini doğrulama kümesine göre kontrol eder.

Doğrulama kümesi, eğitim kümesinden farklı olduğundan doğrulama, aşırı uyum sorununu önlemeye yardımcı olur.

Modeli doğrulama kümesine göre değerlendirmeyi ilk test turu, modeli test kümesine göre değerlendirmeyi ise ikinci test turu olarak düşünebilirsiniz.

doğrulama kaybı

#fundamentals

#Metric

Eğitimin belirli bir iterasyonu sırasında doğrulama kümesindeki bir modelin kaybını temsil eden bir metrik.

Ayrıca genelleştirme eğrisini de inceleyin.

doğrulama seti

#fundamentals

Eğitilmiş bir modele karşı ilk değerlendirmeyi yapan veri kümesinin alt kümesi. Genellikle, eğitilen modeli test kümesine göre değerlendirmeden önce doğrulama kümesine göre birkaç kez değerlendirirsiniz.

Geleneksel olarak, veri kümesindeki örnekleri aşağıdaki üç farklı alt kümeye bölersiniz:

eğitim seti
doğrulama kümesi
test grubu

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Veri kümeleri: Orijinal veri kümesini bölme başlıklı makaleyi inceleyin.

W

ağırlık

#fundamentals

Bir modelin başka bir değerle çarptığı değer. Eğitim, bir modelin ideal ağırlıklarını belirleme sürecidir. Çıkarım ise bu öğrenilmiş ağırlıkları kullanarak tahminlerde bulunma sürecidir.

Doğrusal modeldeki ağırlıkların örneğini görmek için simgeyi tıklayın.

İki özellikli bir doğrusal model olduğunu düşünün. Eğitimin aşağıdaki ağırlıkları (ve bias) belirlediğini varsayalım:

Sapma, b, 2,2 değerine sahiptir.
Bir özellikle ilişkili ağırlık, w₁, 1,5'tir.
Diğer özellikle ilişkili ağırlık, w₂ = 0,4'tür.

Şimdi de aşağıdaki özellik değerlerine sahip bir örnek düşünün:

Bir özelliğin değeri, x₁, 6'dır.
Diğer özellik olan x₂'nin değeri 10'dur.

Bu doğrusal model, y' tahminini oluşturmak için aşağıdaki formülü kullanır:

$$y' = b + w_1x_1 + w_2x_2$$

Bu nedenle tahmin şöyledir:

$$y' = 2.2 + (1.5)(6) + (0.4)(10) = 15.2$$

Ağırlık 0 ise ilgili özellik modele katkıda bulunmaz. Örneğin, w₁ 0 ise x₁ değeri önemli değildir.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Doğrusal regresyon bölümüne bakın.

ağırlıklı toplam

#fundamentals

İlgili tüm giriş değerlerinin toplamının, karşılık gelen ağırlıklarıyla çarpılması. Örneğin, ilgili girişlerin aşağıdakilerden oluştuğunu varsayalım:

giriş değeri	giriş ağırlığı
2	-1,3
-1	0,6
3	0,4

Bu nedenle, ağırlıklı toplam şu şekildedir:

weighted sum = (2)(-1.3) + (-1)(0.6) + (3)(0.4) = -2.0

Ağırlıklı toplam, bir etkinleştirme işlevinin giriş bağımsız değişkenidir.

Z

Z puanı normalleştirme

#fundamentals

Ham özellik değerini, söz konusu özelliğin ortalamasından standart sapma sayısını temsil eden bir kayan nokta değeriyle değiştiren bir ölçeklendirme tekniği. Örneğin, ortalaması 800 ve standart sapması 100 olan bir özelliği ele alalım. Aşağıdaki tabloda, Z puanı normalleştirmenin ham değeri Z puanıyla nasıl eşleyeceği gösterilmektedir:

İşlenmemiş değer	Z puanı
800	0
950	+1,5
575	-2,25

Makine öğrenimi modeli daha sonra ham değerler yerine bu özelliğin Z puanları üzerinde eğitilir.

Daha fazla bilgi için Makine Öğrenimine Hızlı Başlangıç Kursu'ndaki Sayısal veriler: Normalleştirme bölümüne bakın.

Makine Öğrenimi Sözlüğü: Makine Öğrenimiyle İlgili Temel Bilgiler Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

A

doğruluk

Doğruluk ve sınıf dengesizliği olan veri kümeleri hakkında ayrıntılı bilgi için simgeyi tıklayın.

etkinleştirme işlevi

Örnek görmek için simgeyi tıklayın.

yapay zeka

AUC (ROC eğrisinin altındaki alan)

AUC ve ROC eğrileri arasındaki ilişki hakkında bilgi edinmek için simgeyi tıklayın.

AUC'nin daha resmi bir tanımı için simgeyi tıklayın.

B

geri yayılım

grup

grup boyutu

önyargı (etik/adalet)

önyargı (matematik) veya önyargı terimi

ikili sınıflandırma

gruplandırma

Ek notlar için simgeyi tıklayın.

C

kategorik veriler

sınıf

sınıflandırma modeli

sınıflandırma eşiği

Ek notlar için simgeyi tıklayın.

sınıflandırıcı

sınıf dengesizliği olan veri kümesi

kırpma

karışıklık matrisi

sürekli özellik

yakınsama

D

DataFrame

veri kümesi veya veri kümesi

deep model

yoğun özellik

derinlik

ayrı özellik

dinamik

dinamik model

E

erken durdurma

Ek notlar için simgeyi tıklayın.

yerleştirme katmanı

sıfır zaman

örnek

C

yanlış negatif (FN)

yanlış pozitif (FP)

Yanlış pozitif oranı (FPR)

özellik

özellikler arası

özellik mühendisliği

TensorFlow ile ilgili ek notlar için simgeyi tıklayın.

özellik grubu

özellik vektörü

geri bildirim döngüsü

G

genelleştirme

Ek notlar için simgeyi tıklayın.

genelleştirme eğrisi

gradyan inişi

kesin referans

Ek notlar için simgeyi tıklayın.

H

gizli katman

hiperparametre

I

bağımsız ve özdeş dağıtılmış (i.i.d)

çıkarım

giriş katmanı

yorumlanabilirlik

iteration

L

L0 normalleştirmesi

Ek notlar için simgeyi tıklayın.

L1 kaybı

Resmi matematiksel ifadeyi görmek için simgeyi tıklayın.

L1 normalleştirmesi

L2 kaybı

Makine Öğrenimi Sözlüğü: Makine Öğrenimiyle İlgili Temel Bilgiler

L₀ normalleştirmesi

L₁ kaybı

L₁ normalleştirmesi

L₂ kaybı

L₂ normalleştirme