"Üretken Çekişmeli Ağ" adındaki "üretken" ifadesi ne anlama geliyor? "Üretken", ayırt edici modellerle zıt bir istatistik model sınıfını tanımlar.
Gayri resmî olarak:
- Üretken modeller yeni veri örnekleri oluşturabilir.
- Ayırt edici modeller, farklı veri örneği türleri arasında ayrım yapar.
Üretken modeller, gerçek hayvanlara benzeyen yeni hayvan fotoğrafları oluşturabilir. Ayrıştırıcı modeller ise bir köpeği bir kediden ayırt edebilir. GAN'lar, üretken modellerin yalnızca bir türüdür.
Daha resmi bir şekilde, X veri örnekleri ve Y etiketleri kümesi verildiğinde:
- Üretken modeller, ortak olasılığı (p(X, Y)) veya etiket yoksa yalnızca p(X) değerini yakalar.
- Ayırt edici modeller, p(Y | X) koşullu olasılığını yakalar.
Üretken model, verilerin dağıtımını içerir ve belirli bir örneğin olasılığını size bildirir. Örneğin, bir kelime dizisindeki sonraki kelimeyi tahmin eden modeller, kelime dizisine olasılık atayabildikleri için genellikle üretken modellerdir (genellikle GAN'lardan çok daha basittir).
Ayrıştırıcı model, belirli bir örneğin olası olup olmadığı sorusunu yoksayar ve yalnızca bir etiketin örnek için ne kadar olası olduğunu belirtir.
Bunun çok genel bir tanım olduğunu unutmayın. Birçok üretken model türü vardır. GAN'lar, üretken modellerin yalnızca bir türüdür.
Olasılıkları Modelleme
Her iki model türünün de olasılığı temsil eden bir sayı döndürmesi gerekmez. Bu dağılımı taklit ederek verilerin dağılımını modelleyebilirsiniz.
Örneğin, karar ağacı gibi ayırt edici bir sınıflandırıcı, bir örneği etiketleyebilir ancak bu etikete olasılık atamaz. Tahmin edilen tüm etiketlerin dağılımı, verilerdeki etiketlerin gerçek dağılımını modelleyeceğinden, bu tür bir sınıflandırıcı yine de bir modeldir.
Benzer şekilde, üretken bir model, söz konusu dağılımın içinden alınmış gibi görünen ikna edici "sahte" veriler üreterek bir dağılımı modelleyebilir.
Üretken modeller zordur
Üretken modeller, benzer ayırt edici modellere kıyasla daha zor bir görevle karşı karşıyadır. Üretken modellerin daha fazla model oluşturması gerekir.
Resimler için üretken bir model, "tekneye benzeyen nesneler muhtemelen suya benzeyen nesnelerin yakınında görünür" ve "alınlarda göz görülme olasılığı düşüktür" gibi korelasyonlar yakalayabilir. Bunlar çok karmaşık dağıtımlardır.
Buna karşılık, ayırt edici bir model, yalnızca birkaç belirgin kalıp arayarak "yelkenli" ile "yelkenli değil" arasındaki farkı öğrenebilir. Üretken modelin doğru yapması gereken korelasyonların çoğunu göz ardı edebilir.
Ayrıştırıcı modeller veri alanında sınırlar çizmeye çalışırken üretken modeller verilerin alana nasıl yerleştirildiğini modellemeye çalışır. Örneğin, aşağıdaki şemada el yazısıyla yazılmış rakamların ayırt edici ve üretken modelleri gösterilmektedir:
Şekil 1: El yazısı ile yazılmış rakamların ayırt edici ve üretken modelleri.
Ayrıştırıcı model, veri alanında bir çizgi çizerek el yazısıyla yazılmış 0'lar ile 1'ler arasındaki farkı anlamaya çalışır. Doğru çizgiyi bulursa örneklerin çizginin her iki tarafındaki veri alanında tam olarak nereye yerleştirildiğini modellemek zorunda kalmadan 0'ları 1'lerden ayırt edebilir.
Buna karşılık üretken model, veri alanındaki gerçek karşılıklarına yakın gelen basamaklar üreterek ikna edici 1'ler ve 0'lar üretmeye çalışır. Veri alanındaki dağılımı modellemesi gerekir.
GAN'lar, bu tür zengin modelleri gerçek bir dağılıma benzeyecek şekilde eğitmenin etkili bir yolunu sunar. Bu modellerin nasıl çalıştığını anlamak için GAN'ın temel yapısını anlamamız gerekir.
Anlamanızı Kontrol Edin: Üretken ve Ayrıştırıcı Modeller
- Üç altı yüzlü zar atın.
- Dönüşüm değerini sabit bir w değeriyle çarpın.
- Bunu 100 kez tekrarlayın ve tüm sonuçların ortalamasını alın.