Como trabalhar com dados numéricos: teste seu conhecimento

  1. Qual das técnicas a seguir não é uma forma de engenharia de atributos?

  2. Você está treinando um modelo com dados de saúde infantil. Um dos seus recursos é birth_weight. Você quer normalizar esses valores de birth_weight para treinar o modelo com mais eficiência. Qual das técnicas de normalização a seguir provavelmente seria a melhor escolha?

  3. Verdadeiro ou falso: agrupamento por classes é uma técnica para transformar dados categóricos em dados numéricos.

  4. Os dados de treinamento de um modelo de recomendação de sapatos contêm o recurso shoe_size, que deve ter valores entre 6 e 16. A tabela a seguir mostra os valores de shoe_size para seis exemplos no conjunto de dados:

    Exemplo shoe_size
    1 8.5
    2 9
    3 N/A
    4 105
    5 11
    6 9

    Quais exemplos devem ser excluídos do conjunto de dados antes do treinamento? Escolha todas as opções aplicáveis.

    Escolha quantas respostas você achar adequado.

  5. Preencha a lacuna da frase a seguir:
    Durante a engenharia de atributos, é possível criar atributos sintéticos para ___.