Erreur quadratique moyenne
Prenons les deux graphiques suivants:
Explorez les options ci-dessous.
Lequel des deux ensembles de données présentés dans les graphiques précédents présente l'erreur quadratique moyenne la plus élevée ?
L'ensemble de données sur la gauche.
Les six exemples sur la ligne subissent une perte totale de 0. Les quatre exemples qui ne sont pas sur la ligne ne sont pas très éloignés de la ligne. Par conséquent, même si vous mettez carrément leur décalage, vous obtenez une valeur faible : $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 +
0^2} {10} = 0.4$$
L'ensemble de données à droite.
Les huit exemples sur la ligne subissent une perte totale de 0. Toutefois, bien que seuls deux points se trouvent hors de la ligne, ces deux points sont deux fois plus éloignés de la ligne que les points aberrants dans la figure de gauche. La perte quadratique amplifie ces différences. Par conséquent, un décalage de deux subit une perte quatre fois plus importante qu'un décalage d'une différence.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 +
0^2} {10} = 0.8$$