Im August 2024 gibt es eine neue und verbesserte Version des Crashkurses zum maschinellen Lernen. Mehr dazu demnächst!
Ein Test-Dataset ist ein Dataset, mit dem das aus einem Trainings-Dataset entwickelte Modell bewertet wird.
Trainings- und Test-Sets
Datensätze partitionieren
Trainingsbewertung vs. Testbewertung
Was ist, wenn wir nur einen Datenpool haben?
- In zwei Gruppen aufteilen:
- Trainings-Dataset
- Test-Dataset
- Klassischer Wartsch: Nicht mit Testdaten trainieren
- Haben Sie einen überraschend geringen Verlust?
- Prüfen Sie vor dem Feiern, ob Sie versehentlich mit Testdaten trainieren