Travailler avec des données catégorielles: tester vos connaissances

  1. Parmi les exemples suivants, lesquels sont des exemples de données catégorielles ? (Sélectionnez toutes les réponses qui s'appliquent.)

    Choisissez autant de réponses que vous jugez nécessaires.

  2. Vrai ou faux: les étiquettes des machines sont généralement considérées comme plus souhaitables que celles fournies par les évaluateurs manuels.

  3. Vous entraînez un modèle sur un ensemble de données d'entraînement qui inclut la caractéristique eye_color, qui peut correspondre à l'une des six valeurs suivantes: amber, blue, brown, gray, green, hazel.
    Parmi les propositions suivantes, lesquelles sont des encodages valides pour une valeur eye_color de blue ? (Sélectionnez toutes les réponses qui s'appliquent.)

    Choisissez autant de réponses que vous jugez nécessaires.

  4. Dans lequel des scénarios suivants est-il judicieux d'appliquer le hachage des caractéristiques ?

  5. Vous effectuez un croisement des deux caractéristiques catégorielles suivantes:

    • apple_color, qui accepte l'une de ces quatre valeurs: green, red, white ou yellow
    • apple_texture, qui accepte l'une de ces deux valeurs: crisp ou mushy

    Combien d'entrées y a-t-il dans le vecteur de croisement de caractéristiques obtenu ?