Informazioni generali: che cos'è un modello generativo?

Che cosa significa "generativa" nel nome "Rete generativa avversaria"? "Generativo" descrive una classe di modelli statistici in contrasto con i modelli discriminativi.

In modo informale:

I modelli generativi possono generare nuove istanze di dati.
I modelli discriminativi distinguono tra diversi tipi di istanze di dati.

Un modello generativo potrebbe generare nuove foto di animali che sembrano animali reali, mentre un modello discriminante potrebbe distinguere un cane da un gatto. Le GAN sono solo un tipo di modello generativo.

In modo più formale, dato un insieme di istanze di dati X e un insieme di etichette Y:

I modelli generativi acquisiscono la probabilità congiunta p(X, Y) o solo p(X) se non sono presenti etichette.
I modelli discriminativi acquisiscono la probabilità condizionale p(Y | X).

Un modello generativo include la distribuzione dei dati stessi e ti dice quanto è probabile un determinato esempio. Ad esempio, i modelli che prevedono la parola successiva in una sequenza sono in genere modelli generativi (di solito molto più semplici dei GAN) perché possono assegnare una probabilità a una sequenza di parole.

Un modello discriminativo ignora la questione se una determinata istanza è probabile e ti dice solo quanto è probabile che un'etichetta venga applicata all'istanza.

Tieni presente che si tratta di una definizione molto generale. Esistono molti tipi di modelli generativi. Le GAN sono solo un tipo di modello generativo.

Modellazione delle probabilità

Nessuno dei due tipi di modelli deve restituire un numero che rappresenti una probabilità. Puoi modellare la distribuzione dei dati imitando la distribuzione.

Ad esempio, un classificatore discriminatorio come un albero di decisione può etichettare un'istanza senza assegnare una probabilità a quell'etichetta. Un tale classificatore sarebbe comunque un modello perché la distribuzione di tutte le etichette previste modella la distribuzione reale delle etichette nei dati.

Analogamente, un modello generativo può modellare una distribuzione producendo dati "falsi" convincenti che sembrano essere tratti da quella distribuzione.

I modelli generativi sono difficili

I modelli generativi affrontano un compito più difficile rispetto ai modelli discriminativi analoghi. I modelli generativi devono modellare di più.

Un modello generativo per le immagini potrebbe acquisire correlazioni come "gli oggetti che sembrano barche probabilmente appariranno vicino a oggetti che sembrano acqua" e "è improbabile che gli occhi appaiano sulle fronti". Si tratta di distribuzioni molto complicate.

Al contrario, un modello di classificazione potrebbe apprendere la differenza tra "barca a vela" o "non barca a vela" semplicemente cercando alcuni pattern indicativi. Potrebbe ignorare molte delle correlazioni che il modello generativo deve ottenere correttamente.

I modelli di classificazione cercano di tracciare confini nello spazio dei dati, mentre i modelli di generazione cercano di modellare il modo in cui i dati vengono posizionati nello spazio. Ad esempio, il seguente diagramma mostra modelli discriminativi e generativi di cifre scritte a mano:

Figura 1: modelli di cifre scritte a mano discriminativi e generativi.

Il modello di classificazione cerca di distinguere tra gli zeri e gli 1 scritti a mano tracciando una linea nello spazio dei dati. Se individua correttamente la linea, può distinguere gli zeri dagli 1 senza dover mai modellare esattamente dove sono posizionate le istanze nello spazio di dati su entrambi i lati della linea.

Al contrario, il modello generativo cerca di produrre 1 e 0 convincenti generando cifre vicine alle loro controparti reali nello spazio di dati. Deve modellare la distribuzione nello spazio dei dati.

Le GAN offrono un modo efficace per addestrare questi modelli completi in modo che assomiglino a una distribuzione reale. Per capire come funzionano, dobbiamo conoscere la struttura di base di un GAN.

Verifica della comprensione: modelli generativi e discriminativi

Hai i punteggi del QI di 1000 persone. Modella la distribuzione dei punteggi IQ con la seguente procedura:

Tira tre dadi a sei facce.
Moltiplica la rotazione per una costante w.
Ripeti 100 volte e calcola la media di tutti i risultati.

Prova valori diversi per w finché il risultato della procedura non è uguale alla media dei punteggi di QI reali. Il tuo modello è generativo o discriminativo?

Modello generativo

Giusto: con ogni lancio generi effettivamente il QI di una persona immaginaria. Inoltre, il tuo modello generativo tiene conto del fatto che i punteggi del QI sono distribuiti normalmente (ovvero su una curva a campana).

Modello discriminativo

Errato: un modello di classificazione analogo cercherebbe di distinguere tra diversi tipi di punteggi di QI. Ad esempio, un modello discriminativo potrebbe tentare di classificare un QI come falso o reale.

Non sono disponibili informazioni sufficienti.

Questo modello corrisponde effettivamente alla definizione di uno dei nostri due tipi di modelli.

Un modello restituisce una probabilità quando gli viene fornita un'istanza di dati. Questo modello è generativo o discriminativo?

Modello generativo

Un modello generativo può stimare la probabilità dell'istanza e anche la probabilità di un'etichetta di classe.

Modello discriminativo

Un modello discriminativo può stimare la probabilità che un'istanza appartenga a una classe.

Non sono disponibili informazioni sufficienti.

Sia i modelli generativi che quelli discriminanti possono stimare le probabilità (ma non è obbligatorio).

Indietro

Presentazione

Avanti

Panoramica della struttura GAN

Informazioni generali: che cos'è un modello generativo? Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Modellazione delle probabilità

I modelli generativi sono difficili

Verifica della comprensione: modelli generativi e discriminativi

Informazioni generali: che cos'è un modello generativo?