ट्रेनिंग और टेस्ट सेट

टेस्ट सेट एक डेटा सेट है, जिसका इस्तेमाल किसी ट्रेनिंग सेट से बनाए गए मॉडल का आकलन करने के लिए किया जाता है.

ट्रेनिंग और टेस्ट सेट

हॉरिज़ॉन्टल बार को दो हिस्सों में बांटा गया है: इसका 80% हिस्सा ट्रेनिंग सेट और 20% टेस्ट सेट है.
दो मॉडल: एक ट्रेनिंग डेटा पर चलता है और दूसरा टेस्ट डेटा पर.  यह मॉडल बहुत आसान है. इसमें बस एक लाइन है, जो नारंगी बिंदुओं को नीले बिंदुओं से अलग करती है.  ट्रेनिंग डेटा को खोने की समस्या, टेस्ट डेटा को होने वाले नुकसान के बराबर है.
  • दो सेट में बांटें:
    • ट्रेनिंग सेट
    • टेस्ट सेट
  • क्लासिक मिलाचा: टेस्ट डेटा पर ट्रेनिंग न करें
    • अचानक से बहुत कम नुकसान हो रहा है?
    • जश्न मनाने से पहले, देख लें कि कहीं आपने गलती से टेस्ट डेटा की ट्रेनिंग तो नहीं कर ली