यह कई प्लेग्राउंड व्यायामों में से पहला है.
प्लेग्राउंड एक प्रोग्राम है. इसे खास तौर पर,
मशीन लर्निंग के सिद्धांतों को सिखाने के लिए बनाया गया है.
इस कोर्स के हर प्लेग्राउंड व्यायाम में प्रीसेट के साथ एम्बेड किया गया प्लेग्राउंड इंस्टेंस शामिल है.
हर प्लेग्राउंड एक्सरसाइज़ से एक डेटासेट जनरेट होता है. इस डेटासेट के लेबल की
दो संभावित वैल्यू हो सकती हैं. आपके पास इन दो संभावित वैल्यू को स्पैम के तौर पर बनाम स्पैम न होने या स्वस्थ पेड़ों और बीमार पेड़ों के तौर पर शामिल करने का विकल्प होगा.
ज़्यादातर एक्सरसाइज़ का मकसद अलग-अलग हाइपर पैरामीटर में बदलाव
करके ऐसा मॉडल बनाना होता है जो एक लेबल की वैल्यू को दूसरे से सही तरीके से बांट (अलग या अलग करता)
करता हो. ध्यान दें कि ज़्यादातर डेटा सेट में कुछ ऐसा शोर होता है जिसकी वजह से हर उदाहरण की कैटगरी तय करना नामुमकिन हो जाता है.
मॉडल विज़ुअलाइज़ेशन की जानकारी के लिए प्लस आइकॉन पर क्लिक करें.
हर प्लेग्राउंड एक्सरसाइज़, मॉडल की मौजूदा स्थिति का विज़ुअलाइज़ेशन दिखाता है. उदाहरण के लिए, यहां विज़ुअलाइज़ेशन दिया गया है:
मॉडल विज़ुअलाइज़ेशन के बारे में नीचे दी गई बातों पर ध्यान दें:
हर ऐक्सिस एक खास सुविधा को दिखाता है. स्पैम बनाम स्पैम न होने के मामले में,
सुविधाओं में शब्दों की संख्या और ईमेल पाने वाले लोगों की
संख्या शामिल हो सकती है.
हर बिंदु, डेटा के एक उदाहरण के लिए सुविधा की वैल्यू दिखाता है, जैसे कि
ईमेल.
बिंदु का रंग उस क्लास को दिखाता है जिससे उदाहरण जुड़ा है.
उदाहरण के लिए, नीले बिंदु गैर-स्पैम ईमेल को दिखा सकते हैं, जबकि नारंगी बिंदु स्पैम वाले ईमेल को दिखा सकते हैं.
बैकग्राउंड का रंग, मॉडल का यह अनुमान दिखाता है कि उस रंग के उदाहरण कहां मिल सकते हैं. नीले बिंदु के आस-पास नीले रंग के बैकग्राउंड का मतलब है कि मॉडल उस उदाहरण का सही अनुमान लगा रहा है. वहीं, नीले बिंदु के आस-पास नारंगी रंग के बैकग्राउंड का मतलब है कि मॉडल उस उदाहरण का गलत अनुमान लगा रहा है.
बैकग्राउंड के ब्लू और ऑरेंज को स्केल किया गया है. उदाहरण के लिए, विज़ुअलाइज़ेशन का बाईं ओर वाला हिस्सा गहरा नीला है, लेकिन विज़ुअलाइज़ेशन के बीच में
धीरे-धीरे फ़ेड करके सफ़ेद रंग में दिख रहा है. कलर स्ट्रेंथ को इस तरह से समझा जा सकता है,
जिससे यह अनुमान लगाया जा सकता है कि मॉडल कैसा परफ़ॉर्म कर रहा है. गहरे नीले रंग का मतलब है कि मॉडल अपने अनुमान को लेकर काफ़ी हद तक संतुष्ट है. वहीं, हल्के नीले रंग का मतलब है कि मॉडल को लेकर भरोसा कम है. (इमेज में दिखाया गया मॉडल विज़ुअलाइज़ेशन,
अनुमान के हिसाब से सही काम नहीं कर रहा है.)
अपने मॉडल की प्रोग्रेस का आकलन करने के लिए, विज़ुअलाइज़ेशन का इस्तेमाल करें.
("बहुत बढ़िया—ज़्यादातर नीले बिंदुओं का बैकग्राउंड नीले रंग का है" या
"अरे नहीं! नीले बिंदुओं का बैकग्राउंड नारंगी होता है.")
रंगों के अलावा, प्लेग्राउंड
मॉडल की मौजूदा गिरावट को भी अंकों में दिखाता है.
("अरे नहीं! हार, घटने के बजाय बढ़ रही है.")
इस एक्सरसाइज़ के इंटरफ़ेस में तीन बटन मौजूद हैं:
आइकॉन
नाम
यह क्या करता है
रीसेट करें
इटरेशन को 0 पर रीसेट करता है. उन सभी वज़न को रीसेट करता है जिन्हें मॉडल
पहले ही सीख चुका है.
चरण
एक दोहराव को आगे बढ़ाएं. हर बार बदलाव करने पर मॉडल बदल जाता है—कभी-कभी छोटे पैमाने पर और कभी-कभी नाटकीय रूप से बदल जाता है.
फिर से जनरेट करें
नया डेटा सेट जनरेट करता है. इटरेशन को रीसेट नहीं करता.
इस पहले प्लेग्राउंड व्यायाम में, आपको दो टास्क
करके सीखने की दर के साथ प्रयोग करना होगा.
टास्क 1: प्लेग्राउंड के सबसे ऊपर दाईं ओर मौजूद, लर्निंग रेट मेन्यू को देखें. दी गई लर्निंग रेट—3—बहुत ज़्यादा है. "चरण" बटन पर 10 या 20 बार क्लिक करके देखें कि
ज़्यादा लर्निंग रेट से आपके मॉडल पर क्या असर पड़ा है. हर शुरुआती दौर के बाद, ध्यान दें कि मॉडल
विज़ुअलाइज़ेशन कैसे बहुत तेज़ी से बदलता है. मॉडल के आपस में मिलने के बाद भी आपको कुछ अस्थिरता दिख सकती है. साथ ही, मॉडल विज़ुअलाइज़ेशन में x1 और x2
से चलने वाली लाइनें भी देखें. इन लाइनों के वेट,
मॉडल में उन सुविधाओं के महत्व को दिखाते हैं. इसका मतलब है कि एक मोटी लाइन
का मतलब है कि प्रॉडक्ट का वज़न ज़्यादा है.
टास्क 2: ये काम करें:
रीसेट करें बटन दबाएं.
लर्निंग रेट कम करें.
चरण बटन को कई बार दबाएं.
सीखने की दर कम होने से, कन्वर्ज़न पर क्या असर पड़ा? मॉडल को अभिसरण करने के लिए ज़रूरी चरणों की
संख्या की जांच करें. साथ ही, मॉडल कितनी आसानी से
और स्थिर रूप से एक जैसा होता है, यह भी देखें. सीखने की दर के और भी कम
वैल्यू के साथ प्रयोग करें. क्या सीखने की दर बहुत धीमी है? (इस अभ्यास के ठीक
नीचे आपको एक चर्चा मिलेगी.)
टास्क 2 के बारे में चर्चा करने के लिए, प्लस आइकॉन पर क्लिक करें.
प्लेग्राउंड एक्सरसाइज़ की जानी तय नहीं होती है. इसलिए,
हम हमेशा ऐसे जवाब नहीं दे सकते जो आपके डेटा सेट से मिलते-जुलते हों.
हालांकि, 0.1 की सीखने की दर हमारे लिए बहुत कारगर साबित हुई.
छोटी लर्निंग रेट से एक-दूसरे से जुड़ने में ज़्यादा समय लगा. इसका मतलब है कि छोटी सीखने की दर ज़्यादा काम की नहीं थी.