Plongée dans le ML: régression linéaire

Nous savons depuis longtemps que les grillons (une espèce d'insecte) bipe plus fréquemment par temps chaud que par temps plus frais. Depuis des dizaines d'années, des scientifiques professionnels et amateurs recueillent des données sur les stridulations par minute et la température. Pour votre anniversaire, votre tante Ruth vous donne sa base de données de cricket et vous demande d'apprendre un modèle pour prédire cette relation. À l'aide de ces données, vous souhaitez explorer cette relation.

Commencez par examiner vos données en les traçant:

Données brutes des stridulations/minute (axe des abscisses) par rapport à la température (axe des ordonnées).

Figure 1. Chirps par minute et température en degrés Celsius.

Comme prévu, le graphique montre que la température augmente avec le nombre de bips. Cette relation entre les bips et la température est-elle linéaire ? Oui, vous pouvez tracer une seule ligne droite comme suit pour estimer cette relation:

Meilleure ligne établissant la relation entre les stridulations/minute (axe des abscisses) et la température (axe des ordonnées).

Figure 2. Relation linéaire.

Vrai, la ligne ne passe pas à chaque point, mais elle montre clairement la relation entre les stridulations et la température. À l'aide de l'équation d'une ligne, vous pouvez noter cette relation comme suit:

$$ y = mx + b $$

où :

  • \(y\) est la température en degrés Celsius, qui correspond à la valeur que nous essayons de prédire.
  • \(m\) est la pente de la ligne.
  • \(x\) est le nombre de bips par minute, soit la valeur de notre caractéristique d'entrée.
  • \(b\) est l'ordonnée à l'origine.

Par convention dans le machine learning, vous devez écrire l'équation pour un modèle légèrement différemment:

$$ y' = b + w_1x_1 $$

où :

  • \(y'\) est l'étiquette prédite (la sortie souhaitée).
  • \(b\) est le biais (l'ordonnée à l'origine), parfois appelé \(w_0\).
  • \(w_1\) est la pondération de la caractéristique 1. La pondération est un concept identique à celui de la "pente" \(m\) dans l'équation traditionnelle d'une ligne.
  • \(x_1\) est une caractéristique (une entrée connue).

Pour déduire (prédire) la température \(y'\) pour une nouvelle valeur de bips par minute \(x_1\), il vous suffit de remplacer la valeur \(x_1\) dans ce modèle.

Bien que ce modèle n'utilise qu'une seule caractéristique, un modèle plus sophistiqué peut s'appuyer sur plusieurs caractéristiques, chacune ayant une pondération distincte (\(w_1\), \(w_2\), etc.). Par exemple, un modèle qui repose sur trois caractéristiques peut ressembler à ceci:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$