Работа с категориальными данными: проверьте свои знания

  1. Что из перечисленного является примером категориальных данных? (Выберите все, что подходит)

    Выбирайте столько ответов, сколько считаете нужным.

  2. Верно или неверно: машинные этикетки обычно считаются более желательными, чем этикетки, предоставленные оценщиками-людьми.

  3. Вы обучаете модель на наборе обучающих данных, который включает признак eye_color , который может иметь одно из следующих шести значений: amber , blue , brown , gray , green , hazel .
    Какая из следующих кодировок является допустимой кодировкой для blue eye_color ? (Выберите все, что подходит)

    Выбирайте столько ответов, сколько считаете нужным.

  4. В каком из следующих сценариев имеет смысл применять хеширование объектов?

  5. Вы выполняете перекрестное скрещивание следующих двух категориальных признаков:

    • apple_color , который принимает одно из четырех значений: green , red , white или yellow
    • apple_texture , который принимает одно из двух значений: crisp или mushy

    Сколько записей содержится в результирующем векторе перекрестных признаков?