Données catégorielles: exercices de croisement de caractéristiques

Playground est un interactive qui vous permet de manipuler liés à l'entraînement et au test d'un modèle de ML. Avec Playground, vous pouvez sélectionner des caractéristiques et ajuster les hyperparamètres, et découvrir comment vos choix influencent un modèle.

Cette page contient deux exercices Playground.

Exercice 1: Croisement de caractéristiques de base

Pour cet exercice, concentrez-vous sur les parties suivantes de la interface utilisateur:

  • Sous FEATURES (FONCTIONNALITÉS), notez les trois caractéristiques potentielles du modèle: <ph type="x-smartling-placeholder">
      </ph>
    • x1
    • x2
    • x1x2
  • Sous OUTPUT (SORTIE) se trouve un carré contenant et les points bleus. Imaginez que vous regardez une forêt carrée, les points orange indiquent la position des arbres malades et les points bleus indiquent la position la position des arbres sains.
  • Si vous regardez de plus près, entre FEATURES et OUTPUT, vous trouverez trois de faibles lignes en pointillés reliant chaque caractéristique à la sortie. La largeur de chaque ligne en pointillés symbolise la pondération actuellement associée avec chaque fonctionnalité. Ces lignes sont très floues, car la pondération de départ pour chaque caractéristique est initialisé sur 0. Au fur et à mesure que le poids augmente ou diminue, l'épaisseur de ces lignes.

Tâche 1:explorez Playground en procédant comme suit:

  1. Cliquez sur la ligne discrète qui connecte la caractéristique x1 à la sortie. Un pop-up s'affiche.
  2. Dans le pop-up, saisissez une pondération de 1.0.
  3. Appuyez sur Entrée.

Notez les points suivants :

  • La ligne en pointillés de x1 devient plus épaisse à mesure que la pondération augmente. de 0 à 1.0.
  • Un arrière-plan orange et bleu apparaît maintenant.
    • Sur fond orange, le modèle peut deviner où se trouvent les arbres malades. sont les mêmes.
    • Le fond bleu représente l'estimation du modèle quant à l'emplacement des arbres sains sont les mêmes. Le modèle fait un travail horrible. environ la moitié des suppositions du modèle faux.
  • Comme la pondération est de 1,0 pour x1 et de 0 pour les autres caractéristiques, le modèle correspond exactement aux valeurs de x1.

Tâche 2:modifier la pondération de tout ou partie des trois caractéristiques afin que la le modèle (couleurs d'arrière-plan) prédit avec succès "malade et santé" arbres. La solution s'affiche juste en dessous de Playground.



Exercice 2: Croisement de caractéristiques plus sophistiqué

Pour le deuxième exercice, regardez la disposition des points orange (arbres malades). et les points bleus (arbres sains) dans le modèle de sortie, avec les informations suivantes:

  • Les points forment des motifs à peu près sphériques.
  • La disposition des points comporte du bruit ; Par exemple, vous remarquerez que les bleus dans la sphère externe composée de points orange. Par conséquent, même un excellent modèle il est peu probable que chaque point soit correctement prédit.

Tâche 1:explorez l'interface utilisateur de Playground en procédant comme suit:

  1. Cliquez sur le bouton Lecture/Pause, qui est un triangle blanc à l'intérieur d'un cercle. Playground commence à entraîner le modèle. observer le compteur d'époques augmente.
  2. Une fois que le système a été entraîné pendant au moins 300 époques, appuyez sur le bouton Bouton Lecture/Pause pour mettre en pause l'entraînement.
  3. Examinez le modèle. Le modèle réalise-t-il de bonnes prédictions ? Autrement dit, sont les points bleus généralement entourés d'un arrière-plan bleu. points orange généralement cernés par un fond orange ?
  4. Examinez la valeur de la perte de test, qui apparaît juste en dessous de RÉSULTAT. Est-ce une valeur proche de 1,0 (perte plus élevée) ou proche de 0 (perte plus faible) ?
  5. Pour réinitialiser Playground, appuyez sur la flèche incurvée à gauche du Bouton Lecture/Pause.

Tâche 2 : créez un meilleur modèle en procédant comme suit.

  1. Sélectionnez ou désélectionnez toute combinaison des cinq fonctionnalités possibles.
  2. Ajustez le taux d'apprentissage.
  3. Entraînez le système pendant au moins 500 époques.
  4. Évaluez la valeur de la perte de test. Pouvez-vous obtenir une perte de test inférieure à 0,2 ?

Les solutions s'affichent sous Playground.