Datasets, Generalisierung und Überanpassung: Testen Sie Ihr Wissen

  1. Welches der folgenden Beispiele ist ein Beispiel für ein stationäres Dataset?

  2. Sie bereiten ein Modell zur Vorhersage des Verkaufspreises von Gebrauchtwagen mit einem Dataset vor, das die folgenden Merkmale enthält: year, model und mileage. Bei der Untersuchung des Datasets stellen Sie fest, dass bei 150 von 2.500 Beispielen Kilometerwerte fehlen. Welche der folgenden Optionen wären angemessene Maßnahmen? Wähle alle zutreffenden Antworten aus.

    Wählen Sie so viele Antworten, wie Sie für richtig halten.

  3. Sie trainieren das Filmempfehlungsmodell eines Streamingdienstes, um vorherzusagen, ob einem Nutzer ein bestimmter Film gefallen wird. Welche der folgenden Beispiele wären angemessene Proxy-Labels für „Nutzer hat den Film genossen“? Wähle alle zutreffenden Antworten aus.

    Wählen Sie so viele Antworten, wie Sie für richtig halten.

  4. Richtig oder falsch: Wenn Sie Ihr Modell so lange trainieren, bis es einen geringen Verlustwert mit Ihren Testdaten erreicht, lässt sich eine Überanpassung verhindern.

  5. Ergänzen Sie den folgenden Satz:
    Regularisierung verbessert die Fähigkeit Ihres Modells, auf neue Daten zu verallgemeinern, indem ___ während des Trainings bestraft wird.