Conjuntos de dados, generalização e overfitting: teste seu conhecimento

  1. Qual das alternativas a seguir é um exemplo de um conjunto de dados estacionário?

  2. Você está se preparando para treinar um modelo de previsão do preço promocional de carros usados usando um conjunto de dados com os seguintes atributos: year, model e mileage. Ao examinar o conjunto de dados, você descobre que estão faltando valores de quilometragem para 150 de 2.500 exemplos. Quais das opções a seguir seriam ações razoáveis? Escolha todas as opções relevantes.

    Escolha quantas respostas você achar adequado.

  3. Você está treinando o modelo de recomendação de filmes de um serviço de streaming para prever se um usuário gostará ou não de um determinado filme. Quais das opções a seguir seriam rótulos substitutos razoáveis para "O usuário gostou do filme"? Escolha todas as opções relevantes.

    Escolha quantas respostas você achar adequado.

  4. Verdadeiro ou falso: treinar o modelo até que ele atinja um valor de perda baixo nos dados de teste é uma boa maneira de evitar o overfitting.

  5. Preencha a lacuna na frase a seguir:
    A regularização melhora a capacidade do modelo de generalizar novos dados ao penalizar ___ durante o treinamento.