obiektywność: sprawdź swoją wiedzę,

  1. Prawda czy fałsz: odchylenie historyczne występuje, gdy model jest trenowany na starych danych.

  2. Inżynierowie trenują model regresji do przewidywania zawartości kalorii w posiłkach na podstawie różnych danych pozyskanych ze stron z przepisami na całym świecie, w tym wielkości porcji, składników i technik przygotowywania posiłków. Które z tych problemów z danymi są potencjalnymi źródłami uprzedzeń, które należy dokładniej zbadać?

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  3. Model wykrywania sarkazmu został wytrenowany na 80 tys. SMS-ów: 40 000 wiadomości wysłanych przez dorosłych (powyżej 18 roku życia) i 40 000 wiadomości wysyłanych przez osoby nieletnie (poniżej 18 roku życia). Następnie model został oceniony na zbiorze testowym obejmującym 20 000 wiadomości: 10 000 od dorosłych i 10 000 od nieletnich. Poniższe macierz pomyłek przedstawia wyniki dla każdej grupy (podpowiedź pozytywna oznacza klasyfikację „sarkastyczny”, a negatywna oznacza klasyfikację „niesarkastyczny”):

    Dorośli

    Wyniki prawdziwie pozytywne (TP): 512 Wyniki fałszywie pozytywne (FP): 51
    Wyniki fałszywie negatywne (FN): 36 Wartości prawdziwie negatywne (TN): 9401
    Precyzja = TP/(TP + FP) = 0,909
    Czułość = TP/(TP + FN) = 0,934

    Nieletni

    Wyniki prawdziwie pozytywne (TP): 2147 Wyniki fałszywie pozytywne (FP): 96
    Wyniki fałszywie negatywne (FN): 2177 Wartości prawdziwie negatywne (TN): 5580
    Precyzja = TP/(TP + FP) = 0,957
    Czułość = TP/(TP + FN) = 0,497

    Które z tych stwierdzeń na temat skuteczności zestawu testowego modelu jest prawdziwe?

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  4. Która z tych hipotez może wyjaśnić rozbieżności w skuteczności podgrupy w zestawie testowym w powyższym modelu wykrywania sarkazmu?

    Wybierz tyle odpowiedzi, ile uważasz za stosowne.

  5. Inżynierowie pracują nad przetrenowaniem powyższego modelu sarkazmu, aby wyeliminować niespójności w zakresie dokładności wykrywania sarkazmu we wszystkich grupach demograficznych w wieku, ale ten model został już wdrożony do produkcji. Która z tych strategii przerwania pomoże ograniczyć błędy w prognozach modelu?