Dati categorici: esercizi incrociati di caratteristiche

Playground è un un'applicazione interattiva che ti consente di manipolare degli aspetti dell'addestramento e del test di un modello di machine learning. Con Playground puoi selezionare caratteristiche e regolare iperparametri, e scoprire come le tue scelte influenzano un modello.

Questa pagina contiene due esercizi Playground.

Esercizio 1: incrocio di caratteristiche di base

Per questo esercizio, concentrati sulle seguenti parti di Playground dell'interfaccia utente:

  • Sotto FEATURES, sono elencate le tre potenziali caratteristiche del modello:
    • x1
    • x2
    • x1x2
  • Sotto OUTPUT, vedrai un quadrato contenente il colore arancione e punti blu. Immagina di essere in una foresta quadrata, dove i punti arancioni contrassegnano la posizione degli alberi malati, mentre i punti blu contrassegnano la la posizione degli alberi sani.
  • Tra FEATURES e OUTPUT, se guardi molto da vicino, vedrai tre fiamme tratteggiate che collegano ogni caratteristica all'output. La larghezza di ogni linea tratteggiata simboleggia la ponderazione attualmente associata con ciascuna funzionalità. Queste linee sono molto deboli perché la ponderazione iniziale di ciascuna caratteristica è inizializzata a 0. Man mano che il peso aumenta o si riduce, lo spessore di queste linee.

Attività 1: esplora Playground nel seguente modo:

  1. Fai clic sulla linea sottile che collega la caratteristica x1 all'output. Viene visualizzato un popup.
  2. Nella finestra popup, inserisci il peso: 1.0.
  3. Premi Invio.

Tieni presente quanto segue:

  • La linea tratteggiata per x1 diventa più spessa man mano che il peso aumenta. da 0 a 1,0.
  • Ora appare uno sfondo arancione e blu.
    • Lo sfondo arancione indica la posizione degli alberi malati .
    • Lo sfondo blu indica la posizione degli alberi sani del modello . Il modello sta facendo un lavoro pessimo: circa la metà delle ipotesi del modello sbagliato.
  • Poiché il peso è 1,0 per x1 e 0 per le altre caratteristiche, il modello corrisponde esattamente ai valori di x1.

Attività 2: modifica il peso di una o di tutte e tre le caratteristiche in modo che (i colori di sfondo) riesce a prevedere in modo efficace alberi. La soluzione viene visualizzata appena sotto Playground.



Esercizio 2: incrocio di caratteristiche più sofisticato

Per il secondo esercizio, osserva la disposizione dei punti arancioni (alberi malati) e punti blu (alberi integri) nel modello di output, notando quanto segue:

  • I punti formano motivi approssimativamente sferici.
  • La disposizione dei punti è rumorosa; ad esempio, notate occasionalmente punti nella sfera esterna di punti arancioni. Di conseguenza, anche un grande modello è improbabile che preveda correttamente ogni punto.

Attività 1: esplora la UI di Playground nel seguente modo:

  1. Fai clic sul pulsante Esegui/Pausa, un triangolo bianco all'interno di un cerchio. Playground inizierà ad addestrare il modello; osservare il contatore delle epoche aumenta.
  2. Dopo che il sistema è stato addestrato per almeno 300 epoche, premi lo stesso Pulsante Corsa/Pausa per sospendere l'allenamento.
  3. Guarda il modello. Il modello sta facendo buone previsioni? In altre parole, sono i punti blu generalmente circondati da uno sfondo blu e sono i puntini arancioni generalmente circondati da uno sfondo arancione?
  4. Esamina il valore della perdita di test, appena sotto OUTPUT. È questo un valore più vicino a 1,0 (perdita maggiore) o più vicino a 0 (perdita inferiore)?
  5. Reimposta Playground premendo la freccia sinuosa a sinistra dell' Pulsante Esegui/Pausa.

Attività 2: crea un modello migliore seguendo questi passaggi:

  1. Seleziona o deseleziona una qualsiasi combinazione delle cinque possibili funzionalità.
  2. Modificare il tasso di apprendimento.
  3. Addestra il sistema per almeno 500 epoche.
  4. Esaminare il valore di "Test loss". Si può ottenere una perdita di test inferiore a 0,2?

Le soluzioni vengono visualizzate sotto Playground.