Reti neurali multiclasse

In precedenza, hai trovato modelli di classificazione binari in grado di scegliere tra una delle due possibili opzioni, ad esempio se:

  • Un'email specifica è spam o non spam.
  • Un determinato tumore è maligno o innocuo.

In questo modulo analizzeremo la classificazione multi-class, che può scegliere tra più possibilità. Ad esempio:

  • Questo cane è un beagle, un cucciolo o un segugio?
  • Questo fiore è un diaframma siberiano, iris olandese, diaframma blu o diaframma barba?
  • È in volo un Boeing 747, Airbus 320, Boeing 777 o Embraer 190?
  • È un'immagine di una mela, un orso, una caramella, un cane o un uovo?

Alcuni problemi con più classi reali richiedono la scelta di milioni di classi separate. Ad esempio, prendi in considerazione un modello di classificazione multi-classe in grado di identificare l'immagine di qualsiasi argomento.

Reti neurali multiclasse

  • La regressione logistica fornisce probabilità utili per problemi di classe binaria.
    • spam / non spam
    • clic / non clic
  • E per quanto riguarda i problemi di più classi?
    • mela, banana, auto, cardiologo, ..., segno di camminata, zebra, zoo
    • rosso, arancione, giallo, verde, blu, indaco, viola
    • animale, verdura, minerale
  • Crea un output univoco per ogni possibile classe
  • Addestralo con l'indicatore "della mia classe" rispetto a "tutte le altre classi"
  • Puoi farlo in una rete profonda o con modelli separati
Una rete neurale con cinque livelli nascosti e cinque livelli di output.
  • Aggiungi un vincolo aggiuntivo: richiedi l'output di tutti i nodi one-v-all per sommare a 1.0
  • Il vincolo aggiuntivo aiuta l'addestramento a convergere rapidamente
  • Inoltre, consente di interpretare gli output come probabilità
Una rete neurale profonda con un livello di input, due livelli nascosti non descrittivi, un livello Softmax e infine un livello di output con lo stesso numero di nodi del livello Softmax.
  • Classificazione con più etichette e una singola classe:
    • Un esempio può essere membro di un solo corso.
    • Il vincolo che le classi si escludono a vicenda è una struttura utile.
    • È utile codificarlo nella perdita.
    • Utilizza una sola perdita softmax per tutte le classi possibili.
  • Classificazione con più etichette e multi-classe:
    • Un esempio può essere membro di più di una classe.
    • Nessun vincolo aggiuntivo da utilizzare per l'iscrizione a corsi.
    • Una perdita di regressione logistica per ogni possibile classe.
  • Full SoftMax
    • Forza bruta; calcola per tutte le classi.
  • Full SoftMax
    • Forza bruta; calcola per tutte le classi.
  • Campionamento candidati
    • Esegue il calcolo per tutte le etichette positive, ma solo per un campione casuale di valori negativi.