Trainings- und Test-Datasets

Ein Test-Dataset ist ein Dataset, mit dem das aus einem Trainings-Dataset entwickelte Modell bewertet wird.

Trainings- und Test-Sets

Ein horizontaler Balken, der in zwei Teile unterteilt ist: 80% davon sind das Trainings-Dataset und 20% das Test-Dataset.
Zwei Modelle: eines wird mit Trainingsdaten und das andere mit Testdaten ausgeführt.  Das Modell ist sehr simpel: Es handelt sich lediglich um eine Linie, die die orangefarbenen Punkte von den blauen Punkten trennt.  Der Verlust der Trainingsdaten ähnelt dem Verlust der Testdaten.
  • In zwei Gruppen aufteilen:
    • Trainings-Dataset
    • Test-Dataset
  • Klassischer Wartsch: Nicht mit Testdaten trainieren
    • Haben Sie einen überraschend geringen Verlust?
    • Prüfen Sie vor dem Feiern, ob Sie versehentlich mit Testdaten trainieren