नाम और कोटेशन के मतलब में क्या मतलब है? "generative" आंकड़ों के मॉडल की क्लास की जानकारी देता है जो असरदार मॉडल के उलट है.
अनौपचारिक तौर पर:
- जनरेट करने लायक मॉडल नए डेटा इंस्टेंस जनरेट कर सकते हैं.
- अलग-अलग मॉडल, अलग-अलग तरह के डेटा के बीच अंतर करते हैं.
जनरेट करने वाले मॉडल से, उन जानवरों की नई फ़ोटो जनरेट हो सकती हैं जो असली जानवरों की तरह दिखते हैं. वहीं, भेदभाव करने वाला मॉडल किसी बिल्ली के कुत्ते को बता सकता है. जीएएन सिर्फ़ एक तरह का जनरेटर मॉडल है.
औपचारिक रूप से, डेटा इंस्टेंस X और लेबल Y के सेट को देखते हुए:
- जनरेट करने लायक मॉडल कोई लेबल नहीं होने की संभावना वाले p(X, Y) या सिर्फ़ p(X) को कैप्चर करते हैं.
- असरदार मॉडल, शर्तों के हिसाब से बने p(Y | X) को कैप्चर करते हैं.
जनरेट किए जा रहे मॉडल में डेटा को उपलब्ध कराना शामिल है. साथ ही, आपको यह भी पता चलता है कि दिया गया कोई उदाहरण कैसा है. उदाहरण के लिए, किसी क्रम में अगले शब्द का अनुमान लगाने वाले मॉडल आम तौर पर, जनरेट किए गए मॉडल होते हैं (आम तौर पर यह GAN से काफ़ी आसान होता है) क्योंकि वे क्रम में इस्तेमाल होने की संभावना तय कर सकते हैं.
एक भेदभाव वाला मॉडल इस सवाल को अनदेखा करता है कि दिए गए इंस्टेंस की संभावना है या नहीं. साथ ही, यह आपको बताता है कि किसी लेबल पर कितना लेबल लागू होने की संभावना है.
ध्यान रखें कि यह एक बहुत ही सामान्य परिभाषा है. जनरेट करने लायक कई तरह के मॉडल हैं. GAN, एक तरह का सामान्य मॉडल है.
मॉडलिंग की संभावना
किसी भी तरह के मॉडल को संभावना दिखाने वाली संख्या नहीं देनी होती. आप उस डिस्ट्रिब्यूशन की नकल करके, डेटा के डिस्ट्रिब्यूशन को मॉडल कर सकते हैं.
उदाहरण के लिए, डिसिज़न ट्री जैसे भेदभाव करने वाली कैटगरी का इस्तेमाल करने वाले इंस्टेंस को, लेबल की संभावना दिए बिना ही लेबल किया जा सकता है. डेटा की कैटगरी तय करने वाला ऐसा मॉडल अब भी एक मॉडल होगा, क्योंकि अनुमानित लेबल का डिस्ट्रिब्यूशन डेटा में मौजूद लेबल का असल डिस्ट्रिब्यूशन होगा.
इसी तरह, एक जनरेटिव मॉडल, कन्वर्ज़न और फ़र्ज़ी" डेटा की मदद से एक डिस्ट्रिब्यूशन मॉडल कर सकता है, जो ऐसा लगता है कि उस डिस्ट्रिब्यूशन से ड्रॉ किया गया है.
जनरेट करने वाले मॉडल हार्ड होते हैं
उम्मीद के मुताबिक बनाए गए मॉडल, एनालॉगिव मॉडल की तुलना में ज़्यादा मुश्किल काम करते हैं. जनरेट किए जाने वाले मॉडल को, ज़्यादा मॉडल बनाना होता है.
इमेज के लिए एक जनरेट किए गए मॉडल से, कोट और कोट जैसी चीज़ें दिख सकती हैं. ऐसा लगता है कि नाव की तरह दिखने वाली चीज़ों के आस-पास पानी और कोट जैसी दिखने वाली चीज़ें होती हैं. ऐसा हो सकता है कि इमेज, माथे पर न दिखें." ये बहुत जटिल डिस्ट्रिब्यूशन हैं.
वहीं दूसरी तरफ़, मॉडल बताने वाला एक मॉडल अलग-अलग पैटर्न के ज़रिए "sailboat" या "sailboat"के बीच का अंतर सीख सकता है. यह ऐसे कई संबंधों को अनदेखा कर सकता है जिन्हें जनरेट करने वाले मॉडल को सही करना चाहिए.
भेदभाव वाले मॉडल, डेटा स्पेस में सीमाएं तय करने की कोशिश करते हैं. हालांकि, सामान्य मॉडल, पूरे स्पेस में डेटा डालने का तरीका बताते हैं. उदाहरण के लिए, यह डायग्राम, हाथ से लिखे गए अंकों में भेदभाव करने वाला और जनरेट करने वाला मॉडल दिखाता है:
पहली इमेज: हाथ से लिखे गए अंकों में भेदभाव वाला और जनरेट करने वाला मॉडल.
भेदभाव वाला मॉडल, डेटा स्पेस में लाइन को हाथ से लिखे हुए 0' और 1's के बीच अंतर बताने की कोशिश करता है. अगर लाइन को सही लाइन में लगा दिया जाता है, तो 0' की जगह को 1' से अलग नहीं किया जा सकता है.
इसके उलट, जनरेटर मॉडल, 1' 0's को समझाने के लिए डेटा बनाने की कोशिश करता है. इसे पूरे डेटा स्पेस में डिस्ट्रिब्यूशन को मॉडल करना होता है.
जीएएन ऐसे रिच मॉडल को ट्रेनिंग देने का एक असरदार तरीका है, जो असली डिस्ट्रिब्यूशन जैसा लगता है. हम कैसे काम करते हैं यह समझने के लिए, GAN की बुनियादी संरचना को समझना ज़रूरी है.
अपनी समझ की जांच करें: जनरेट करने वाले बनाम भेदभाव वाले मॉडल
- छह साइड वाला पासा फेंकें.
- रोल को कॉन्सटेंट x से गुणा करें.
- इसे 100 बार दोहराएं और सभी नतीजों का औसत लें.