Questa pagina è stata tradotta dall'API Cloud Translation. Equità: verifica le tue conoscenze Torna al percorso Vero o falso: il bias storico si verifica quando un modello viene addestrato su dati vecchi. True False Gli ingegneri stanno addestrando un modello di regressione per prevedere il contenuto di calorie dei pasti in base a una varietà di dati sulle caratteristiche estratti da siti web di ricette in tutto il mondo, tra cui porzioni, ingredienti e tecniche di preparazione. Quali dei seguenti problemi relativi ai dati sono potenziali fonti di bias che dovrebbero essere ulteriormente approfonditi? Scegli tutte le risposte che ritieni adeguate. A circa 4000 dei 40.000 esempi di addestramento manca un valore per la caratteristica "dimensione di pubblicazione". Circa 5.000 degli esempi di addestramento avevano misurazioni in unità imperiali (once, libbre, ecc.), mentre gli altri 35.000 esempi avevano misurazioni in unità metriche (grammi, litri, ecc.). Circa 100 dei 40.000 esempi di addestramento avevano valori degli ingredienti che sembravano molto probabilmente errati (ad es. 100 spicchi di burro). Alcuni pasti popolari erano sottorappresentati nei dati di addestramento rispetto ad altri pasti popolari (ad es. c'erano 200 esempi di addestramento per la dosa, ma solo 10 per la pizza). Un modello di rilevamento del sarcasmo è stato addestrato su 80.000 SMS: 40.000 messaggi inviati da adulti (dai 18 anni in su) e 40.000 messaggi inviati da minorenni (di età inferiore ai 18 anni). Il modello è stato poi valutato su un set di test di 20.000 messaggi: 10.000 da adulti e 10.000 da minorenni. Le seguenti matrici di confusione mostrano i risultati per ciascun gruppo (una previsione positiva indica una classificazione di "sarcastico"; una previsione negativa indica una classificazione di "non sarcastico"): Adulti veri positivi (VP): 512 Falsi positivi (FP): 51 Falsi negativi (FN): 36 Vero negativo (TN): 9401 Precisione = VP/(VP + FP) = 0,909 Richiamo = VP/(VP + FN) = 0,934 Minorenni veri positivi (TP): 2147 Falsi positivi (FP): 96 Falsi negativi (FN): 2177 Vero negativo (VN): 5580 Precisione = VP/(VP + FP) = 0,957 Richiamo = VP/(VP + FN) = 0,497 Quali delle seguenti affermazioni sulle prestazioni del set di test del modello sono vere? Scegli tutte le risposte che ritieni adeguate. Il modello ha un rendimento migliore su esempi di adulti che su esempi di minorenni. I 10.000 messaggi inviati da adulti rappresentano un set di dati non bilanciato in base alla classe. I 10.000 messaggi inviati dai minorenni sono un set di dati non bilanciato dalla classe. Circa il 50% dei messaggi inviati da minorenni viene classificato erroneamente come "sarcastico". Il modello non riesce a classificare come "sarcastico" circa il 50% dei messaggi sarcastici dei minorenni. Quale delle seguenti ipotesi potrebbe spiegare le discrepanze nelle prestazioni dei sottogruppi nel set di test per il modello di rilevamento del sarcasmo sopra indicato? Scegli tutte le risposte che ritieni adeguate. Il modello genera troppi errori nel prevedere "sarcastico". Di conseguenza, commette più errori nella classificazione dei contenuti SMS, perché nel set di test sono presenti messaggi più sarcastici da parte di minorenni. Il modello è stato valutato sulla base di esempi più negativi (non sarcastici) di minorenni che di adulti, determinando un maggior numero di errori per i minorenni. Il sarcasmo nei messaggi inviati dai minorenni era più discreto, per cui il modello aveva meno probabilità di essere segnalato. Ci sono molti meno messaggi sarcastici reali da parte di adulti che da minorenni. Se il modello è stato valutato su un insieme più equilibrato di classe di messaggi per adulti, il richiamo potrebbe diminuire per quel sottogruppo. Gli ingegneri stanno lavorando per riaddestrare il modello di sarcasmo descritto sopra per risolvere le incoerenze nell'accuratezza del rilevamento del sarcasmo nei gruppi demografici di età, ma il modello è già stato messo in produzione. Quale delle seguenti strategie di stopgap contribuirà a mitigare gli errori nelle previsioni del modello? Limita l'utilizzo del modello ai messaggi inviati da minorenni. Modifica l'output del modello in modo che restituisca "sarcastico" per tutti i messaggi inviati dai minorenni, indipendentemente da ciò che il modello ha previsto inizialmente. Quando il modello prevede "non sarcastico" per i messaggi inviati dai minorenni, modifica l'output in modo che il modello restituisca invece il valore "incerto". Invia risposte error_outline Si è verificato un errore durante la valutazione del quiz. Riprova.