Set di dati, generalizzazione e overfitting: verifica le tue conoscenze

  1. Quale dei seguenti è un esempio di set di dati stazionario?

  2. Stai preparando l'addestramento di un modello per prevedere il prezzo di vendita delle auto usate utilizzando un set di dati che contiene le seguenti caratteristiche: year, model e mileage. Esaminando il set di dati, scopri che mancano i valori del chilometraggio in 150 esempi su 2500. Quali delle seguenti opzioni sarebbero ragionevoli azioni da intraprendere? (Seleziona tutte le opzioni pertinenti)

    Scegli tutte le risposte che ritieni adeguate.

  3. Stai addestrando il modello di consigli sui film di un servizio di streaming per prevedere se un utente apprezzerà o meno un determinato film. Quali delle seguenti etichette proxy sarebbero ragionevoli per la definizione "L'utente ha apprezzato il film"? (Seleziona tutte le opzioni pertinenti)

    Scegli tutte le risposte che ritieni adeguate.

  4. Vero o falso: addestrare il modello fino a quando non raggiunge un valore di perdita basso sui dati di test è un buon modo per evitare l'overfitting.

  5. Completa gli spazi vuoti nella frase seguente:
    La regolarizzazione migliora la capacità del modello di generalizzare in base a nuovi dati penalizzando ___ durante l'addestramento.