Ta strona została przetłumaczona przez Cloud Translation API. obiektywność: sprawdź swoją wiedzę, Wróć do ścieżki Prawda czy fałsz: odchylenie historyczne występuje, gdy model jest trenowany na starych danych. Prawda Fałsz Inżynierowie trenują model regresji do przewidywania zawartości kalorii w posiłkach na podstawie różnych danych pozyskanych ze stron z przepisami na całym świecie, w tym wielkości porcji, składników i technik przygotowywania posiłków. Które z tych problemów z danymi są potencjalnymi źródłami uprzedzeń, które należy dokładniej zbadać? Wybierz tyle odpowiedzi, ile uważasz za stosowne. W około 4000 z 40 000 przykładów treningowych brakowało wartości atrybutu „rozmiar wyświetlania”. Około 5000 przykładów treningowych miało miary w jednostkach imperialnych (uncje, funty itp.), a w pozostałych 35 000 przykładów miary były podawane w jednostkach metrycznych (gramach, litrach itp.). Około 100 z 40 000 przykładów treningowych miało wartości składników, które prawdopodobnie były nieprawidłowe (np. 100 kostek masła). Niektóre popularne posiłki były niedostatecznie reprezentowane w danych treningowych w porównaniu z innymi popularnymi posiłkami (np. 200 przykładów treningowych do dosa, ale tylko 10 w przypadku pizzy). Model wykrywania sarkazmu został wytrenowany na 80 tys. SMS-ów: 40 000 wiadomości wysłanych przez dorosłych (powyżej 18 roku życia) i 40 000 wiadomości wysyłanych przez osoby nieletnie (poniżej 18 roku życia). Następnie model został oceniony na zbiorze testowym obejmującym 20 000 wiadomości: 10 000 od dorosłych i 10 000 od nieletnich. Poniższe macierz pomyłek przedstawia wyniki dla każdej grupy (podpowiedź pozytywna oznacza klasyfikację „sarkastyczny”, a negatywna oznacza klasyfikację „niesarkastyczny”): Dorośli Wyniki prawdziwie pozytywne (TP): 512 Wyniki fałszywie pozytywne (FP): 51 Wyniki fałszywie negatywne (FN): 36 Wartości prawdziwie negatywne (TN): 9401 Precyzja = TP/(TP + FP) = 0,909 Czułość = TP/(TP + FN) = 0,934 Nieletni Wyniki prawdziwie pozytywne (TP): 2147 Wyniki fałszywie pozytywne (FP): 96 Wyniki fałszywie negatywne (FN): 2177 Wartości prawdziwie negatywne (TN): 5580 Precyzja = TP/(TP + FP) = 0,957 Czułość = TP/(TP + FN) = 0,497 Które z tych stwierdzeń na temat skuteczności zestawu testowego modelu jest prawdziwe? Wybierz tyle odpowiedzi, ile uważasz za stosowne. Model osiąga lepsze wyniki na przykładach dorosłych niż na przykładach nieletnich. 10 000 wiadomości wysyłanych przez osoby dorosłe znajduje się w zbiorze danych o niezrównoważonym klasie. 10 000 wiadomości wysyłanych przez osoby nieletnie znajduje się w zbiorze danych o niezrównoważonym klasie. Około 50% wiadomości wysyłanych przez osoby nieletnie jest błędnie klasyfikowanych jako „sarkastyczne”. Model nie klasyfikuje około 50% sarkastycznych wiadomości osób nieletnich jako „sarkastycznych”. Która z tych hipotez może wyjaśnić rozbieżności w skuteczności podgrupy w zestawie testowym w powyższym modelu wykrywania sarkazmu? Wybierz tyle odpowiedzi, ile uważasz za stosowne. Model popełnia zbyt wiele błędów, aby uznać, że to „sarkastyczny”. Oznacza to, że popełnia więcej błędów podczas klasyfikowania filmów nieletnich. SMS-y, bo w grupie testowej są bardziej sarkastyczne wiadomości od nieletnich. Model został oceniony na podstawie bardziej negatywnych (niesarkastycznych) przykładów przedstawiających osoby nieletnie niż dorosłych, co spowodowało większą liczbę błędów u nieletnich. Sarkaz w SMS-ach wysyłanych przez osoby nieletnie był bardziej subtelny, dzięki czemu model z mniejszym prawdopodobieństwem zostanie ogłoszony przez model. Jest znacznie mniej prawdziwych sarkastycznych wiadomości od dorosłych niż od nieletnich. Jeśli model został oceniony na podstawie bardziej zrównoważonego zbioru wiadomości dla dorosłych, jego czułość w tej podgrupie może się zmniejszyć. Inżynierowie pracują nad przetrenowaniem powyższego modelu sarkazmu, aby wyeliminować niespójności w zakresie dokładności wykrywania sarkazmu we wszystkich grupach demograficznych w wieku, ale ten model został już wdrożony do produkcji. Która z tych strategii przerwania pomoże ograniczyć błędy w prognozach modelu? Ograniczyć użycie modelu tylko do SMS-ów wysyłanych przez osoby nieletnie. Dostosuj dane wyjściowe modelu tak, aby w przypadku wszystkich SMS-ów wysyłanych przez osoby nieletnie, niezależnie od pierwotnej prognozy modelu, były one zwracane „sarkastyczne”. Gdy model przewiduje, że SMS-y wysyłane przez osoby nieletnie będą oznaczone jako „nie sarkastyczne”, dostosuj dane wyjściowe, aby model zwracał wartość „nie wiem”. Prześlij odpowiedzi error_outline Podczas oceniania testu wystąpił błąd. Spróbuj ponownie.