Cet exercice Playground est le premier d'une série qui en compte plusieurs.
Playground est un programme
développé spécialement pour ce cours afin d'enseigner les principes du machine learning.
Chaque exercice Playground de ce cours inclut une instance Playground intégrée avec des préréglages.
Chaque exercice Playground génère un ensemble de données. L'étiquette de ce jeu de données
a deux valeurs possibles. Vous pouvez considérer ces deux valeurs comme spam ou non-spam, ou encore arbres sains ou malades.
L'objectif de la plupart des exercices est de modifier différents hyperparamètres pour créer un modèle qui classe (sépare ou distingue) correctement une valeur d'étiquette par rapport à l'autre. Notez que la plupart des ensembles de données contiennent une certaine quantité de bruit qui empêche de classer correctement chaque exemple.
Cliquez sur l'icône Plus pour obtenir une explication de la visualisation du modèle.
Chaque exercice Playground affiche une visualisation de l'état actuel du modèle. Par exemple, voici une visualisation:
Notez les points suivants à propos de la visualisation du modèle:
Chaque axe représente une caractéristique spécifique. Dans le cas de spam ou non, les caractéristiques peuvent être le nombre de mots et le nombre de destinataires de l'e-mail.
Chaque point représente les valeurs des caractéristiques pour un exemple de données, tel qu'un e-mail.
La couleur du point représente la classe à laquelle appartient l'exemple.
Par exemple, les points bleus peuvent représenter les e-mails non-spam, tandis que les points orange peuvent représenter les spams.
La couleur d'arrière-plan représente la prédiction du modèle concernant l'emplacement des exemples de cette couleur. Un point bleu sur un arrière-plan bleu
signifie que le modèle prédit correctement cet exemple. À l'inverse,
un point bleu sur fond orange signifie que le modèle
prédit incorrectement cet exemple.
Les couleurs bleues et orange d'arrière-plan sont mises à l'échelle. Par exemple, le côté gauche de la visualisation est en bleu uni, mais passe progressivement au blanc au centre de la visualisation. Vous pouvez considérer l'intensité de la couleur comme une indication de la confiance du modèle vis-à-vis de son estimation. Ainsi, le bleu fixe signifie que le modèle est très fiable quant à sa estimation, et le bleu clair signifie que le modèle l'est moins. (La prédiction du modèle illustrée ici est médiocre.)
Utilisez la visualisation pour évaluer la progression de votre modèle.
("Excellent, la plupart des points bleus ont un arrière-plan bleu" ou
"Oh non ! les points bleus ont un arrière-plan orange.")
Outre les couleurs, Playground affiche numériquement la perte actuelle du modèle.
("Oh non ! la perte augmente au lieu de diminuer.")
L'interface de cet exercice comporte trois boutons:
Icon
Nom
Description
Réinitialiser
Remet les itérations à zéro. Réinitialise toutes les pondérations que le modèle a déjà apprises.
Step
Avancer d'une itération. À chaque itération, le modèle change, parfois subtilement et parfois considérablement.
Regénérer
Génère un nouvel ensemble de données. Ne réinitialise pas les itérations.
Dans ce premier exercice Playground, vous allez tester le
taux d'apprentissage en effectuant deux tâches.
Tâche 1:notez le menu Taux d'apprentissage en haut à droite du
Playground. Le taux d'apprentissage donné (3) est très élevé. Observez comment un taux d'apprentissage élevé affecte votre modèle en cliquant sur le bouton "Pas" 10 ou 20 fois. Après chaque itération, notez que la
visualisation du modèle change considérablement. Vous pourriez même constater une certaine instabilité
après que le modèle semble avoir convergé. Notez également les lignes allant de x1 à x2 jusqu'à la visualisation du modèle. La pondération de ces lignes indique celle de ces caractéristiques dans le modèle. Autrement dit, une
ligne épaisse indique une pondération élevée.
Tâche 2:procédez comme suit:
Appuyez sur le bouton Réinitialiser.
Réduisez le taux d'apprentissage.
Appuyez plusieurs fois sur le bouton Pas.
Quel a été l'impact de la diminution du taux d'apprentissage sur la convergence ? Examinez à la fois
le nombre d'étapes nécessaires pour que le modèle converge, ainsi que la fluidité
et la régularité de la convergence du modèle. Expérimentez avec des valeurs encore plus
faibles pour le taux d'apprentissage. Trouvez-vous un taux d'apprentissage trop lent pour être utile ? (Une discussion se trouve juste en dessous de l'exercice.)
Cliquez sur l'icône plus pour afficher une discussion sur la tâche 2.
En raison de la nature non déterministe des exercices Playground,
nous ne pouvons pas toujours fournir des réponses qui correspondent exactement à votre ensemble de données.
Cela dit, un taux d'apprentissage de 0,1 a convergé efficacement pour nous.
La convergence des taux d'apprentissage plus faibles a pris beaucoup plus de temps. En d'autres termes, les taux d'apprentissage plus faibles étaient trop lents pour être utiles.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.