क्लस्टरिंग वर्कफ़्लो

डेटा को क्लस्टर करने के लिए, यह तरीका अपनाएं:

  1. डेटा तैयार करें.
  2. मिलती-जुलती मेट्रिक बनाएं.
  3. क्लस्टरिंग एल्गोरिदम चलाएं.
  4. नतीजों को समझें और क्लस्टर करने की सुविधा में बदलाव करें.

इस पेज पर, इस प्रोसेस के बारे में कम शब्दों में बताया गया है. हम अगले सेक्शन में इस बारे में ज़्यादा जानकारी देंगे.

डेटा तैयार करना

किसी भी एमएल समस्या की तरह, आपको उस डेटा पर मॉडल को ट्रेनिंग देने या उसे बेहतर बनाने से पहले, फ़ीचर डेटा को सामान्य बनाना, स्केल करना, और बदलना होगा. इसके अलावा, क्लस्टर बनाने से पहले, देख लें कि तैयार किए गए डेटा की मदद से, उदाहरणों के बीच समानता का सटीक हिसाब लगाया जा सकता है या नहीं.

मिलती-जुलती चीज़ों की मेट्रिक बनाना

क्लस्टरिंग एल्गोरिदम, डेटा को ग्रुप करने से पहले यह जानता है कि उदाहरणों के जोड़े कितने मिलते-जुलते हैं. मिलती-जुलती मेट्रिक बनाकर, उदाहरणों के बीच समानता का आकलन किया जा सकता है. इसके लिए, आपको अपने डेटा को ध्यान से समझना होगा.

क्लस्टरिंग एल्गोरिदम चलाना

क्लस्टरिंग एल्गोरिदम, डेटा को क्लस्टर करने के लिए मिलती-जुलती मेट्रिक का इस्तेमाल करता है. इस कोर्स में, k-means का इस्तेमाल किया जाता है.

नतीजों को समझना और उनमें बदलाव करना

क्लस्टर करने की प्रोसेस में, "सही" जानकारी नहीं मिलती या शामिल नहीं होती. इसकी मदद से, आउटपुट की पुष्टि नहीं की जा सकती. इसलिए, क्लस्टर लेवल और उदाहरण के लेवल, दोनों पर अपनी उम्मीदों के हिसाब से नतीजे देखना ज़रूरी है. अगर नतीजा अजीब या खराब क्वालिटी का दिखता है, तो पिछले तीन चरणों को आज़माएं. जब तक आउटपुट की क्वालिटी आपकी ज़रूरतों के मुताबिक न हो जाए, तब तक इसे दोहराते रहें.