Praca z danymi kategorialnymi: sprawdź swoją wiedzę

  1. Które z tych elementów są przykładami danych kategorialnych? (Wybierz wszystkie pasujące odpowiedzi)

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  2. Prawda czy fałsz: etykiety maszyn są zwykle uważane za bardziej pożądane niż etykiety dostarczane przez weryfikatorów.

  3. Trenujesz model na zbiorze danych treningowych zawierającym funkcję eye_color, która może być jedną z 6 tych wartości: amber, blue, brown, gray, green, hazel.
    Które z poniższych opcji kodowania są prawidłowe dla wartości eye_color o wartości blue? (Wybierz wszystkie pasujące odpowiedzi)

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  4. W którym z tych scenariuszy warto zastosować haszowanie cech?

  5. Wykonujesz porównanie cech z tych 2 rodzajów:

    • apple_color, która przyjmuje jedną z tych 4 wartości: green, red, white lub yellow
    • apple_texture, który przyjmuje jedną z tych 2 wartości: crisp lub mushy

    Ile wpisów składa się w wynikowym wektorze krzyżowym cech?