Incorporamenti

Un incorporamento è uno spazio di dimensioni relativamente basse in cui puoi tradurre vettori di dimensioni elevate. Gli incorporamenti semplificano l'esecuzione del machine learning su input di grandi dimensioni, come i vettori sparsi che rappresentano le parole. L'incorporamento ideale potrebbe rappresentare una parte della semantica dell'input posizionando gli input semanticamente simili tra loro nello spazio di incorporamento. Un modello di incorporamento può essere utilizzato e riutilizzato nei vari modelli.

Incorporamenti

  • Input: 1.000.000 di film che 500.000 utenti hanno scelto di guardare
  • Attività: consiglia i film agli utenti

Per risolvere questo problema è necessario un metodo per determinare quali film siano simili tra loro.

Un elenco di film ordinati in una sola riga da sinistra a destra. A partire da sinistra, 'Shrek', 'The Incredibles', 'The Triplets of Belleville', 'Harry Potter', 'Star Wars', 'Bleu',',', ##

Lo stesso elenco di film nella diapositiva precedente ma disposto su due dimensioni, ad esempio 'Shrek' si trova a sinistra e sopra di 'Gli incredibili

Simile al diagramma precedente, ma con asse ed etichette per ogni quadrante. La disposizione dei film è la seguente: nel primo, in alto a destra il riquadro è Adult blockbuster contenenti 'Star Wars' e 'The Dark Knight Rises' con i film 'Hero' e 'Crouching Tiger, Hidden Dragon' sono stati aggiunti al Adultsbuster Il secondo quadrante in basso a destra è Adult Arthouse contenente i film 'Bleu' e 'Memento' con 'Waking Life' aggiunto al quadrante Adult Arthouse. Il terzo riquadro in basso a sinistra è Children Arthouse e contiene il film 'The Triplets of Belleville' e 'Wallace and Gromit' viene aggiunto al quadrante per Children Arthouse. Il quarto e ultimo quadrante in alto a sinistra è Children Blockbuster che contiene 'Shrek', 'Gli incredibili' e 'Harry Potter' e il film 'Scuola di Rock' viene aggiunto al quadrante Bambini di successo.

La stessa disposizione dell'ultima diapositiva. 'Shrek' e 'Bleu' sono evidenziati come esempi delle loro coordinate nel piano di incorporamento 2D.

  • Si presuppone che l'interesse degli utenti per i film possa essere spiegato in modo approssimativo dagli aspetti "d"
  • Ogni film diventa un punto d-dimensionale in cui il valore nella dimensione d rappresenta quanto il film si adatta a tale aspetto
  • Gli incorporamenti possono essere appresi dai dati
  • Non è necessario un processo di addestramento separato: il livello di incorporamento è solo un livello nascosto con un'unità per dimensione
  • Le informazioni supervisionati (ad es. gli utenti che hanno guardato gli stessi due film) personalizzano gli incorporamenti appresi per l'attività desiderata
  • Intuitivamente le unità nascoste scoprono come organizzare gli elementi nello spazio d-dimensionale in modo da ottimizzare al meglio l'obiettivo finale
  • Ogni esempio (una riga in questa matrice) è un vettore spagnole di elementi (film) che sono stati guardati dall'utente.
  • Rappresentazione densa di questo esempio come: (0, 1, 0, 1, 0, 0, 0, 1)

Non è efficiente in termini di spazio e tempo.

Una tabella in cui ogni intestazione di colonna è un film e ogni riga rappresenta un utente e i film che ha guardato.
  • Crea un dizionario mappando ogni caratteristica a un numero intero compreso tra 0, ..., # film - 1
  • Rappresenta in modo efficace il sparse vettori dei soli film guardati dall'utente. Potrebbe essere rappresentato come segue: In base alla posizione della colonna dei film nel libero spaventoso visualizzata a destra, i film 'The Triplets from Belleville', 'Wallace and Gromit' e 'Memento' possono essere rappresentati in modo efficace come (0,1, 999999)
Un vettore sparto rappresentato come una tabella con ciascuna colonna che rappresenta un film e ogni riga che rappresenta un utente. La tabella contiene i film dei diagrammi precedenti ed è numerata da 1 a 999999. Ogni cella della tabella viene controllata se un utente ha guardato un film.

Problema di regressione per prevedere i prezzi di vendita delle case:

Un diagramma di una rete neurale profonda utilizzata per prevedere i prezzi di vendita della casa

Problema di regressione per prevedere i prezzi di vendita delle case:

Diagramma di una rete neurale profonda utilizzata per prevedere i prezzi di vendita di un'abitazione
  (evidenziata la codifica vettoriale sparsa)

Problema di regressione per prevedere i prezzi di vendita delle case:

Un diagramma di una rete neurale profonda utilizzata per prevedere i prezzi di vendita della casa
  (con il livello di incorporamento tridimensionale nascosto evidenziato)

Problema di regressione per prevedere i prezzi di vendita delle case:

Diagramma di una rete neurale profonda utilizzata per prevedere i prezzi di vendita della casa
  (con caratteristiche di input di latitudine e longitudine aggiuntive evidenziate)

Problema di regressione per prevedere i prezzi di vendita delle case:

Un diagramma di una rete neurale profonda utilizzata per prevedere i prezzi di vendita della casa
  (le caratteristiche di input si nascondono in più livelli nascosti evidenziati)

Problema di regressione per prevedere i prezzi di vendita delle case:

Un diagramma di una rete neurale profonda utilizzata per prevedere i prezzi di vendita della casa (output della rete neurale profonda evidenziata)

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere le cifre scritte a mano.

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere le cifre scritte a mano
  (inserisci la codifica vettoriale sparsa evidenziata)

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere le cifre scritte a mano libera (altre funzionalità evidenziate).

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere cifre scritte a mano libera (incorporamento tridimensionale evidenziato).

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere le cifre scritte a mano
  (livelli nascosti evidenziati)

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere le cifre scritte a mano libera (livello di log evidenziato)

Classificazione multiclasse per prevedere una cifra scritta a mano:

Diagramma di una rete neurale profonda utilizzata per prevedere le cifre scritte a mano
  (livello della classe target evidenziato)

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare
  (livello della classe target evidenziato)

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare (evidenziata la codifica vettoriale sparsa)

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare
  (l'incorporamento tridimensionale evidenziato)

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare
  (altre funzionalità evidenziate)

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare
  (livelli nascosti evidenziati)

Filtro collaborativo per prevedere i film da consigliare:

Diagramma di una rete neurale profonda utilizzata per prevedere quali film consigliare
  (livello di log evidenziato)

Rete profonda

  • Ognuna delle unità nascoste corrisponde a una dimensione (funzionalità latente)
  • Gli spessori dei bordi tra un filmato e il livello nascosto sono valori di coordinate
  • Un diagramma ad albero di una rete neurale profonda con un nodo nel livello più basso collegato a tre punti nel livello successivo successivo

Visualizzazione geometrica dell'incorporamento di un singolo film

Un punto in uno spazio tridimensionale corrispondente al nodo del livello inferiore nel diagramma di rete neurale profonda.
  • Gli incorporamenti di dimensioni più elevate possono rappresentare in modo più accurato le relazioni tra i valori di input.
  • Ma più dimensioni aumentano le possibilità di overfit e porta a un allenamento più lento.
  • Regola empirica (un buon punto di partenza, ma che dovrebbe essere regolata utilizzando i dati di convalida):
  • $$ dimensions \approx \sqrt[4]{possible\;values} $$
  • Incorporamenti di elementi mappati (ad es. film, testo ecc.) in vettori reali di bassa dimensione in modo che elementi simili siano vicini tra loro
  • Gli incorporamenti possono essere applicati anche a dati densi (ad es. audio) per creare una metrica di somiglianza significativa
  • Incorporare congiuntamente vari tipi di dati (ad esempio testo, immagini, audio...) definisce una somiglianza tra loro