Überanpassung bedeutet, dass ein Modell erstellt wird, die mit den Trainingssatz, damit dass das Modell keine richtigen Vorhersagen für neue Daten trifft. Ein überangepasstes Modell ist analog zu einer Erfindung, die im Labor gut funktioniert, aber ist in der realen Welt wertlos.
Stellen Sie sich in Abbildung 11 vor, dass jede geometrische Form die Position eines Baums darstellt. in einem quadratischen Wald. Die blauen Rauten kennzeichnen die Standorte gesunder Bäume, während die Standorte erkrankter Bäume durch orangefarbene Kreise gekennzeichnet sind.
Zeichnen Sie mental alle Formen – Linien, Kurven, Ovale usw. –, um die gesunden Bäumen von den kranken Bäumen ab. Maximieren Sie dann die nächste Zeile, eine mögliche Trennung.
Bei den in Abbildung 12 gezeigten komplexen Formen wurden bis auf zwei alle Bäume. Wenn wir uns die Formen als Modell vorstellen, ist dies Modell.
Oder vielleicht doch? Ein wirklich hervorragendes Modell kategorisiert erfolgreich neue Beispiele. In Abbildung 13 sehen Sie, was passiert, wenn dasselbe Modell Vorhersagen für neue Beispiele aus dem Test-Dataset:
Das in Abbildung 12 gezeigte komplexe Modell hat also beim Trainings-Dataset aber auf den Test-Datasets ziemlich schlecht. Dies ist ein klassischer Fall eines Modells, Überanpassung an die Daten des Trainings-Datasets.
Anpassung, Überanpassung und Unteranpassung
Ein Modell muss gute Vorhersagen für neue Daten treffen. Das heißt, Sie möchten ein Modell erstellen, neuen Daten.
Wie Sie gesehen haben, trifft ein Überanpassungsmodell hervorragende Vorhersagen für das Training. aber schlechte Vorhersagen für neue Daten zu treffen. Eine Unteranpassung-Modell macht noch keine guten Vorhersagen anhand der Trainingsdaten. Wenn ein überangepasstes Modell wie ein Produkt, das im Labor gut, aber in der realen Welt schlecht funktioniert, ist ein Unterfit-Modell ein Produkt, das in im Labor.
Generalisierung ist die das Gegenteil von Überanpassung. Das heißt, ein Modell, das gut verallgemeinert, erzielt gute Vorhersagen zu neuen Daten. Ihr Ziel ist es, ein Modell zu erstellen, auf neue Daten übertragen.
Überanpassung erkennen
Mit den folgenden Kurven können Sie eine Überanpassung erkennen:
- Verlustkurven
- Generalisierungskurven
In einer Verlustkurve wird der Verlust eines Modells dargestellt. mit der Anzahl der Trainingsdurchläufe. Ein Diagramm, das zwei oder mehr Verlustkurven zeigt, wird als Generalisierung Kurve. Die folgenden Die Generalisierungskurve zeigt zwei Verlustkurven:
Beachten Sie, dass sich die beiden Verlustkurven zunächst ähnlich verhalten und dann divergieren. Das heißt, nach einer bestimmten Anzahl von Iterationen bleibt für das Trainings-Dataset konstant (konvergiert), erhöht sich jedoch für das Validierungs-Dataset. Das deutet auf eine Überanpassung hin.
Im Gegensatz dazu zeigt eine Generalisierungskurve für ein gut angepasstes Modell zwei Verlustkurven. die ähnliche Formen haben.
Wodurch entsteht eine Überanpassung?
Ganz allgemein gesprochen wird eine Überanpassung durch eine oder beide der folgenden Ursachen verursacht: Probleme:
- Das Trainings-Dataset repräsentiert reale Daten nicht angemessen (oder Validierungs- oder Test-Dataset).
- Das Modell ist zu komplex.
Generalisierungsbedingungen
Ein Modell wird mit einem Trainings-Dataset trainiert. Der tatsächliche Wert eines Modells macht sie Vorhersagen für neue Beispiele, insbesondere bei realen Daten. Bei der Entwicklung eines Modells dient Ihr Test-Dataset als Stellvertreter für reale Daten. Wenn Sie ein Modell trainieren, das gut generalisierbar ist, bedeutet das die folgenden Dataset-Bedingungen:
- Beispiele: unabhängig und identisch verteilt ist, mit dem Sie sagen können, Beispiele können sich nicht gegenseitig beeinflussen.
- Das Dataset ist stationär, d. h. dass sich das Dataset im Laufe der Zeit nicht wesentlich ändert.
- Die Dataset-Partitionen haben die gleiche Verteilung. Das heißt, die Beispiele im Trainings-Dataset sind statistisch ähnlich wie die Beispiele im Validierungs-Dataset, im Test-Dataset und in realen Daten.
Sehen Sie sich die vorherigen Bedingungen mithilfe der folgenden Übungen an.
Übungen: Wissen testen
Challenge-Training
Sie erstellen ein Modell, das das ideale Datum für den Kauf eines Zugfahrkarte für eine bestimmte Route. Zum Beispiel könnte das Modell dass Nutzer ihr Ticket am 8. Juli für einen Zug kaufen, der am 23. Juli abfährt. Das Bahnunternehmen aktualisiert die Preise stündlich und stützt sich dabei auf verschiedene sondern hauptsächlich von der aktuellen Anzahl der verfügbaren Plätze. Das bedeutet:
- Wenn viele Sitzplätze verfügbar sind, sind die Ticketpreise in der Regel niedrig.
- Wenn nur sehr wenige Sitzplätze verfügbar sind, sind die Ticketpreise in der Regel hoch.
Antwort:Das reale Modell hat mit einem Feedback Loop:
Angenommen, das Modell empfiehlt den Nutzern, Tickets am 8. Juli zu kaufen. Einige Fahrgäste, die die Empfehlung des Modells nutzen, kaufen ihre Tickets um 08:30 Uhr am 8. Juli morgens. Um 9:00 Uhr erhöht die Bahngesellschaft die Preise, weil es sind jetzt weniger Sitzplätze verfügbar. Fahrgäste, die die Empfehlung des Modells nutzen, geänderte Preise. Abends können die Ticketpreise viel höher sein als in der morgens.