Diese Seite wurde von der Cloud Translation API übersetzt. Fairness: Testen Sie Ihr Wissen Zurück zum Lernpfad Richtig oder falsch: Eine historische Verzerrung tritt auf, wenn ein Modell mit alten Daten trainiert wird. Wahr Falsch Entwickler trainieren ein Regressionsmodell, um den Kaloriengehalt von Mahlzeiten basierend auf einer Vielzahl von Featuredaten vorherzusagen, die sie von Rezepten auf der ganzen Welt entnommen haben, darunter Portionsgröße, Zutaten und Zubereitungstechniken. Welche der folgenden Datenprobleme sind potenzielle Quellen für Verzerrungen, die weiter untersucht werden sollten? Wählen Sie so viele Antworten, wie Sie für richtig halten. In etwa 4.000 der 40.000 Trainingsbeispiele fehlte ein Wert für das Feature „Auslieferungsgröße“. Ungefähr 5.000 der Trainingsbeispiele enthielten Maße in imperialen Einheiten (Unzen, Pfund usw.), während die anderen 35.000 Messwerte in metrischen Einheiten (Gramm, Liter usw.) hatten. Ungefähr 100 der 40.000 Trainingsbeispiele hatten Werte zu Inhaltsstoffen, die mit hoher Wahrscheinlichkeit falsch zu sein schienen (z. B. 100 Stück Butter). Einige beliebte Mahlzeiten waren in den Trainingsdaten im Vergleich zu anderen beliebten Mahlzeiten unterrepräsentiert (z.B. gab es 200 Trainingsbeispiele für Dosa, aber nur 10 für Pizza). Ein Modell zur Sarkasmuserkennung wurde mit 80.000 SMS trainiert: 40.000 Nachrichten von Erwachsenen (18 Jahre und älter) und 40.000 Nachrichten von Minderjährigen (unter 18 Jahren). Das Modell wurde dann anhand eines Test-Datasets von 20.000 Nachrichten bewertet: 10.000 von Erwachsenen und 10.000 von Minderjährigen. Die folgenden Wahrheitsmatrizen zeigen die Ergebnisse für jede Gruppe (eine positive Vorhersage bedeutet eine Klassifizierung als „sarkastisch“; eine negative Vorhersage bedeutet eine Klassifizierung als „nicht sarkastisch“): Erwachsene Richtig-Positive (TPs): 512 Falsch positive Ergebnisse: 51 Falsch negative Ergebnisse: 36 Richtig negative Ergebnisse (TNs): 9.401 Precision = TP/(TP + FP) = 0,909 Trefferquote = TP/(TP + FN) = 0,934 Minderjährige Richtig-Positives (TPs): 2147 Falsch positive Ergebnisse: 96 Falsch negative Ergebnisse: 2.177 Richtig negative Ergebnisse (TNs): 5.580 Precision = TP/(TP + FP) = 0,957 Trefferquote = TP/(TP + FN) = 0,497 Welche der folgenden Aussagen zur Testsatzleistung des Modells treffen zu? Wählen Sie so viele Antworten, wie Sie für richtig halten. Das Modell funktioniert bei Beispielen von Erwachsenen besser als bei Beispielen von Minderjährigen. Die 10.000 Nachrichten, die von Erwachsenen gesendet werden, sind ein Dataset mit unausgeglichener Klasse. Die 10.000 von Minderjährigen gesendeten Nachrichten sind ein Dataset mit unausgeglichener Klasse. Ungefähr 50% der Nachrichten, die von Minderjährigen versendet werden, werden fälschlicherweise als „sarkastisch“ eingestuft. Das Modell klassifiziert ungefähr 50% der sarkastischen Nachrichten Minderjähriger nicht als „sarkastisch“. Welche der folgenden Hypothesen könnte die Diskrepanz bei der Untergruppenleistung im Test-Dataset für das obige Modell zur Sarkasmuserkennung erklären? Wählen Sie so viele Antworten, wie Sie für richtig halten. Das Modell sagt im Zweifelsfall zu sehr „sarkastisch“. Dadurch entstehen mehr Fehler bei der Klassifizierung von SMS, da es mehr sarkastische Nachrichten von Minderjährigen im Test-Dataset gibt. Das Modell wurde anhand von mehr negativen (nicht sarkastischen) Beispielen von Minderjährigen als von Erwachsenen bewertet, was zu mehr Fehlern bei Minderjährigen führte. Sarkasmus in den SMS von Minderjährigen war subtiler und wurde daher vom Modell eher nicht erkannt. Es gibt weitaus weniger sarkastische Nachrichten von Erwachsenen als von Minderjährigen. Wenn das Modell anhand einer Gruppe von nicht jugendfreien Nachrichten ausgewertet würde, die auf Klassen ausgerichtet sind, könnte der Recall für diese Untergruppe sinken. Die Entwickler trainieren das oben genannte Sarkasmusmodell neu, um die Genauigkeit der Sarkasmuserkennung über alle demografischen Merkmale hinweg zu beseitigen, aber das Modell wurde bereits in die Produktion aufgenommen. Welche der folgenden provisorischen Strategien trägt dazu bei, Fehler in den Vorhersagen des Modells zu minimieren? Die Nutzung des Modells auf Textnachrichten beschränken, die von Minderjährigen gesendet werden. Passen Sie die Modellausgabe so an, dass für alle von Minderjährigen gesendeten Textnachrichten „sarkastisch“ zurückgegeben wird, unabhängig davon, was das Modell ursprünglich vorhergesagt hat. Wenn das Modell für von Minderjährigen gesendete Textnachrichten „nicht sarkastisch“ sagt, passen Sie die Ausgabe so an, dass das Modell stattdessen den Wert „unsicher“ zurückgibt. Antworten senden error_outline Beim Bewerten des Quiz ist ein Fehler aufgetreten. Bitte versuchen Sie es noch einmal.