अपने डेटा को इकट्ठा करने के लिए, आपको यह तरीका अपनाना होगा:
- डेटा तैयार करें.
- समानता वाली मेट्रिक बनाएं.
- क्लस्टरिंग एल्गोरिदम चलाएं.
- नतीजों को समझें और अपनी कैटगरी को अडजस्ट करें.
इस पेज पर, इन चरणों के बारे में बताया गया है. हम इस बारे में विस्तार से बात करेंगे कि सेक्शन.
डेटा तैयार करें
मशीन लर्निंग से जुड़ी किसी भी समस्या की तरह, आपको फ़ीचर डेटा को नॉर्मलाइज़, स्केल, और ट्रांसफ़ॉर्म करना होगा ट्रेनिंग से पहले या उस डेटा पर किसी मॉडल को बेहतर बनाने से पहले. इसके अलावा, पहले क्लस्टरिंग के लिए, देखें कि तैयार किए गए डेटा से दिया गया है.
समानता वाली मेट्रिक बनाएं
क्लस्टरिंग एल्गोरिदम, डेटा को ग्रुप में बांट सकती है, उससे पहले उसे यह जानना ज़रूरी है कि कितना मिलता-जुलता है उदाहरणों की जोड़ी हैं. उदाहरणों के बीच समानता को इस तरह मापा जा सकता है मिलती-जुलती मेट्रिक बना रही हैं. इसके लिए, आपको अपने डेटा शामिल है.
क्लस्टरिंग एल्गोरिदम चलाएं
क्लस्टरिंग एल्गोरिदम, क्लस्टर डेटा के लिए, समानता वाली मेट्रिक का इस्तेमाल करता है. इस कोर्स में k-मीन का इस्तेमाल किया जाता है.
नतीजों को समझें और उनमें बदलाव करें
क्योंकि क्लस्टरिंग से कोई ज़मीनी "सच" नहीं बनती या उसमें शामिल नहीं होती जिसकी वजह से आपने आउटपुट की पुष्टि कर सकते हैं, तो यह ज़रूरी है कि आप क्लस्टर लेवल और उदाहरण के लेवल, दोनों पर लागू उम्मीदों के बारे में बताया गया है. अगर नतीजे में अजीब या कम गुणवत्ता वाला लगता है, तो पिछले तीन चरणों के साथ प्रयोग करें. जारी रखें प्रोसेस को तब तक दोहराएं, जब तक कि आउटपुट की क्वालिटी आपकी ज़रूरतों के मुताबिक न हो जाए.