Arka plan: Üretken model nedir?

"Üretken Çekişmeli Ağ" adındaki "üretken" ifadesi ne anlama geliyor? "Üretken", ayırt edici modellerle zıt bir istatistik model sınıfını tanımlar.

Gayri resmî olarak:

  • Üretken modeller yeni veri örnekleri oluşturabilir.
  • Ayırt edici modeller, farklı veri örneği türleri arasında ayrım yapar.

Üretken modeller, gerçek hayvanlara benzeyen yeni hayvan fotoğrafları oluşturabilir. Ayrıştırıcı modeller ise bir köpeği bir kediden ayırt edebilir. GAN'lar, üretken modellerin yalnızca bir türüdür.

Daha resmi bir şekilde, X veri örnekleri ve Y etiketleri kümesi verildiğinde:

  • Üretken modeller, ortak olasılığı (p(X, Y)) veya etiket yoksa yalnızca p(X) değerini yakalar.
  • Ayırt edici modeller, p(Y | X) koşullu olasılığını yakalar.

Üretken model, verilerin dağıtımını içerir ve belirli bir örneğin olasılığını size bildirir. Örneğin, bir kelime dizisindeki sonraki kelimeyi tahmin eden modeller, kelime dizisine olasılık atayabildikleri için genellikle üretken modellerdir (genellikle GAN'lardan çok daha basittir).

Ayrıştırıcı model, belirli bir örneğin olası olup olmadığı sorusunu yoksayar ve yalnızca bir etiketin örnek için ne kadar olası olduğunu belirtir.

Bunun çok genel bir tanım olduğunu unutmayın. Birçok üretken model türü vardır. GAN'lar, üretken modellerin yalnızca bir türüdür.

Olasılıkları Modelleme

Her iki model türünün de olasılığı temsil eden bir sayı döndürmesi gerekmez. Bu dağılımı taklit ederek verilerin dağılımını modelleyebilirsiniz.

Örneğin, karar ağacı gibi ayırt edici bir sınıflandırıcı, bir örneği etiketleyebilir ancak bu etikete olasılık atamaz. Tahmin edilen tüm etiketlerin dağılımı, verilerdeki etiketlerin gerçek dağılımını modelleyeceğinden, bu tür bir sınıflandırıcı yine de bir modeldir.

Benzer şekilde, üretken bir model, söz konusu dağılımın içinden alınmış gibi görünen ikna edici "sahte" veriler üreterek bir dağılımı modelleyebilir.

Üretken modeller zordur

Üretken modeller, benzer ayırt edici modellere kıyasla daha zor bir görevle karşı karşıyadır. Üretken modellerin daha fazla model oluşturması gerekir.

Resimler için üretken bir model, "tekneye benzeyen nesneler muhtemelen suya benzeyen nesnelerin yakınında görünür" ve "alınlarda göz görülme olasılığı düşüktür" gibi korelasyonlar yakalayabilir. Bunlar çok karmaşık dağıtımlardır.

Buna karşılık, ayırt edici bir model, yalnızca birkaç belirgin kalıp arayarak "yelkenli" ile "yelkenli değil" arasındaki farkı öğrenebilir. Üretken modelin doğru yapması gereken korelasyonların çoğunu göz ardı edebilir.

Ayrıştırıcı modeller veri alanında sınırlar çizmeye çalışırken üretken modeller verilerin alana nasıl yerleştirildiğini modellemeye çalışır. Örneğin, aşağıdaki şemada el yazısıyla yazılmış rakamların ayırt edici ve üretken modelleri gösterilmektedir:

Biri "Ayırt Edici Model", diğeri "Üretken Model" etiketli iki grafik. Her iki grafikte de aynı dört veri noktası gösterilmektedir. Her nokta, temsil ettiği el yazısı rakamın resmiyle etiketlenir. Ayrıştırıcı grafikte, iki veri noktasını diğer ikisinden ayıran noktalı bir çizgi vardır. Noktalı çizginin üzerindeki bölge "y=0", çizginin altındaki bölge ise "y=1" olarak etiketlenmiştir. Üretken grafikte, iki nokta çiftinin etrafında iki noktalı çizgi daire çizilir. Üst daire "y=0", alt daire ise "y=1" olarak etiketlenmiştir.

Şekil 1: El yazısı ile yazılmış rakamların ayırt edici ve üretken modelleri.

Ayrıştırıcı model, veri alanında bir çizgi çizerek el yazısıyla yazılmış 0'lar ile 1'ler arasındaki farkı anlamaya çalışır. Doğru çizgiyi bulursa örneklerin çizginin her iki tarafındaki veri alanında tam olarak nereye yerleştirildiğini modellemek zorunda kalmadan 0'ları 1'lerden ayırt edebilir.

Buna karşılık üretken model, veri alanındaki gerçek karşılıklarına yakın gelen basamaklar üreterek ikna edici 1'ler ve 0'lar üretmeye çalışır. Veri alanındaki dağılımı modellemesi gerekir.

GAN'lar, bu tür zengin modelleri gerçek bir dağılıma benzeyecek şekilde eğitmenin etkili bir yolunu sunar. Bu modellerin nasıl çalıştığını anlamak için GAN'ın temel yapısını anlamamız gerekir.

Anlamanızı Kontrol Edin: Üretken ve Ayrıştırıcı Modeller

1.000 kişinin IQ puanlarına sahipsiniz. IQ puanlarının dağılımını aşağıdaki prosedürle modellersiniz:
  1. Üç altı yüzlü zar atın.
  2. Dönüşüm değerini sabit bir w değeriyle çarpın.
  3. Bunu 100 kez tekrarlayın ve tüm sonuçların ortalamasını alın.
İşleminizin sonucu gerçek IQ puanlarının ortalamasına eşit olana kadar w için farklı değerler denersiniz. Modeliniz üretken mi yoksa ayırt edici mi?
Üretken model
Doğru: Her zar atışında, hayali bir kişinin IQ'sunu etkili bir şekilde oluşturursunuz. Ayrıca üretken modeliniz, IQ puanlarının normal dağıldığını (yani, çan eğrisi şeklinde) yansıtır.
Ayrımcı model
Yanlış: Benzer bir ayırt edici model, farklı türde IQ puanları arasında ayrım yapmaya çalışır. Örneğin, ayırt edici bir model bir IQ'yu sahte veya gerçek olarak sınıflandırmayı deneyebilir.
Bunu söylemek için yeterli bilgi yok.
Bu model, iki model türümüzden birine uyuyor.
Bir modele veri örneği verdiğinizde model bir olasılık döndürür. Bu model, üretken bir model mi yoksa ayırt edici bir model mi?
Üretken model
Üretken modeller, örneğin olasılığını ve sınıf etiketinin olasılığını tahmin edebilir.
Ayrımcı model
Ayrıştırıcı modeller, bir örneğin bir sınıfa ait olma olasılığını tahmin edebilir.
Bunu söylemek için yeterli bilgi yok.
Hem üretken hem de ayırt edici modeller olasılıkları tahmin edebilir (ancak bunu yapmak zorunda değildir).