Une nouvelle version améliorée du cours d'initiation au machine learning sera disponible en août 2024. Tenez-vous informé !

Cette page a été traduite par l'API Cloud Translation.

Régularisation à des fins de simplicité: testez vos connaissances

Régularisation L₂

Explorez les options ci-dessous.

Imaginons un modèle linéaire avec 100 caractéristiques d'entrée:

10 d'entre elles sont très informatives.

90 ne sont pas informatives.

Supposons que les valeurs de toutes les caractéristiques soient comprises entre -1 et 1. Parmi les affirmations suivantes, lesquelles sont vraies ?

Grâce à la régularisation L₂, un grand nombre de pondérations non informatives seront proches de (mais pas exactement égales) à 0,0.

Oui, la régularisation L₂ fait en sorte que les pondérations soient proches de 0,0, mais pas exactement égales à 0,0.

Suite à une régularisation L₂, la plupart des pondérations non informatives seront exactement égales à 0,0.

La régularisation L₂ n'a pas tendance à forcer les pondérations à être exactement égales à 0,0. La régularisation L₂ pénalise plus les pondérations élevées que les pondérations faibles. Lorsqu'une pondération se rapproche de 0,0, la "L₂" la "pousse" avec moins de force vers 0,0.

La régularisation L₂ peut amener le modèle à apprendre une pondération modérée pour certaines caractéristiques non informatives.

Étonnamment, cela peut se produire lorsqu'une caractéristique non informative est corrélée au libellé. Dans ce cas, le modèle accorde à tort à ces caractéristiques non informatives une part du "crédit" qui aurait dû être accordée aux caractéristiques informatives.

Régularisation L₂ et caractéristiques corrélées

Explorez les options ci-dessous.

Imaginez un modèle linéaire avec deux caractéristiques fortement corrélées ; c'est-à-dire que ces deux caractéristiques sont des copies presque identiques l'une de l'autre, mais que l'une d'elles contient une petite quantité de bruit aléatoire. Si nous entraînons ce modèle avec une régularisation L₂, qu'adviendra-t-il des pondérations de ces deux caractéristiques ?

Les deux caractéristiques auront des pondérations modérées à peu près égales.

La régularisation L₂ obligera les caractéristiques à atteindre des pondérations à peu près équivalentes, qui représentent environ la moitié de ce qu'elles auraient été si une seule des deux caractéristiques avait été présente dans le modèle.

La pondération de l'une des deux caractéristiques sera élevée, tandis que celle de l'autre sera presque de 0,0.

La régularisation L₂ pénalise plus les pondérations élevées que les pondérations faibles. Ainsi, même si une pondération commençait à diminuer plus rapidement que l'autre, la régularisation L₂ obligerait la pondération la plus élevée à diminuer plus rapidement que la pondération la plus faible.

La pondération de l'une des deux caractéristiques est élevée, tandis que celle de l'autre est exactement de 0,0.

La régularisation L₂ oblige rarement les pondérations à être exactement égales à 0,0. En revanche, la régularisation L₁ (que nous verrons plus tard) force les pondérations à être exactement égales à 0,0.

Exercice Playground: régularisation L2

Cours vidéo

Régularisation à des fins de simplicité: testez vos connaissances

Régularisation L2

Régularisation L2 et caractéristiques corrélées

Régularisation L₂

Régularisation L₂ et caractéristiques corrélées