Equità: verifica le tue conoscenze

  1. Vero o falso: il bias storico si verifica quando un modello viene addestrato su dati vecchi.

  2. Gli ingegneri stanno addestrando un modello di regressione per prevedere il contenuto di calorie dei pasti in base a una varietà di dati sulle caratteristiche estratti da siti web di ricette in tutto il mondo, tra cui porzioni, ingredienti e tecniche di preparazione. Quali dei seguenti problemi relativi ai dati sono potenziali fonti di bias che dovrebbero essere ulteriormente approfonditi?

    Scegli tutte le risposte che ritieni adeguate.

  3. Un modello di rilevamento del sarcasmo è stato addestrato su 80.000 SMS: 40.000 messaggi inviati da adulti (dai 18 anni in su) e 40.000 messaggi inviati da minorenni (di età inferiore ai 18 anni). Il modello è stato poi valutato su un set di test di 20.000 messaggi: 10.000 da adulti e 10.000 da minorenni. Le seguenti matrici di confusione mostrano i risultati per ciascun gruppo (una previsione positiva indica una classificazione di "sarcastico"; una previsione negativa indica una classificazione di "non sarcastico"):

    Adulti

    veri positivi (VP): 512 Falsi positivi (FP): 51
    Falsi negativi (FN): 36 Vero negativo (TN): 9401
    Precisione = VP/(VP + FP) = 0,909
    Richiamo = VP/(VP + FN) = 0,934

    Minorenni

    veri positivi (TP): 2147 Falsi positivi (FP): 96
    Falsi negativi (FN): 2177 Vero negativo (VN): 5580
    Precisione = VP/(VP + FP) = 0,957
    Richiamo = VP/(VP + FN) = 0,497

    Quali delle seguenti affermazioni sulle prestazioni del set di test del modello sono vere?

    Scegli tutte le risposte che ritieni adeguate.

  4. Quale delle seguenti ipotesi potrebbe spiegare le discrepanze nelle prestazioni dei sottogruppi nel set di test per il modello di rilevamento del sarcasmo sopra indicato?

    Scegli tutte le risposte che ritieni adeguate.

  5. Gli ingegneri stanno lavorando per riaddestrare il modello di sarcasmo descritto sopra per risolvere le incoerenze nell'accuratezza del rilevamento del sarcasmo nei gruppi demografici di età, ma il modello è già stato messo in produzione. Quale delle seguenti strategie di stopgap contribuirà a mitigare gli errori nelle previsioni del modello?