Conjuntos de datos, generalización y sobreajuste: prueba tus conocimientos

  1. ¿Cuál de los siguientes es un ejemplo de un conjunto de datos estacionario?

  2. Te preparas para entrenar un modelo que prediga el precio de oferta de los autos usados con un conjunto de datos que contiene los siguientes atributos: year, model y mileage. Cuando examinas el conjunto de datos, descubres que faltan los valores de kilometraje para 150 de 2,500 ejemplos. ¿Cuál de las siguientes opciones serían medidas razonables para tomar? (Seleccione todas las opciones que correspondan).

    Selecciona todas las respuestas que consideres correctas.

  3. Está entrenando el modelo de recomendación de películas de un servicio de transmisión para predecir si un usuario disfrutará o no de una película determinada. ¿Cuáles de las siguientes opciones serían etiquetas de proxy razonables para "El usuario disfrutó la película"? (Seleccione todas las opciones que correspondan).

    Selecciona todas las respuestas que consideres correctas.

  4. Verdadero o falso: Entrenar tu modelo hasta que alcance un valor de pérdida bajo en los datos de prueba es una buena manera de evitar el sobreajuste.

  5. Completa el espacio en blanco en la siguiente oración:
    La regularización mejora la capacidad de tu modelo para generalizar sobre datos nuevos mediante la penalización de ___ durante el entrenamiento.