Travailler avec des données numériques: tester vos connaissances

  1. Laquelle des techniques suivantes n'est pas une forme d'ingénierie des caractéristiques ?

  2. Vous entraînez un modèle avec des données sur la santé des nourrissons. birth_weight est l'une de vos caractéristiques. Vous souhaitez normaliser ces valeurs birth_weight pour entraîner le modèle plus efficacement. Parmi les techniques de normalisation suivantes, laquelle serait probablement le meilleur choix ?

  3. Vrai ou faux: le binning est une technique permettant de transformer des données catégorielles en données numériques.

  4. Les données d'entraînement d'un modèle de recommandation de chaussures contiennent la caractéristique shoe_size, qui doit contenir des valeurs comprises entre 6 et 16. Le tableau suivant présente les valeurs shoe_size pour six exemples de l'ensemble de données:

    Exemple shoe_size
    1 8.5
    2 9
    3 N/A
    4 105
    5 11
    6 9

    Quels exemples devriez-vous envisager d'effacer de l'ensemble de données avant l'entraînement ? (Plusieurs réponses possibles)

    Choisissez autant de réponses que vous jugez nécessaires.

  5. Complétez la phrase suivante:
    Lors de l'ingénierie des caractéristiques, des caractéristiques synthétiques peuvent être créées pour ___.