Qu'est-ce que le machine learning ?

Le machine learning (ML) alimente certaines des technologies les plus importantes que nous utilisons, des applications de traduction aux véhicules autonomes. Ce cours explique les concepts de base du ML.

Le ML offre une nouvelle façon de résoudre des problèmes, de répondre à des questions complexes et de créer du contenu. Le ML peut prédire la météo, estimer les temps de trajet, recommander des chansons, compléter automatiquement des phrases, résumer des articles et générer des images inédites.

En termes simples, le ML est le processus d'entraînement d'un logiciel, appelé modèle, pour effectuer des prédictions utiles ou générer du contenu (comme du texte, des images, de l'audio ou des vidéos) à partir de données.

Par exemple, supposons que nous voulions créer une application pour prédire les précipitations. Nous pouvons utiliser une approche traditionnelle ou une approche de ML. Avec une approche traditionnelle, nous créerions une représentation basée sur la physique de l'atmosphère et de la surface de la Terre, en calculant d'énormes quantités d'équations de dynamique des fluides. C'est incroyablement difficile.

En utilisant une approche de ML, nous fournissons à un modèle de ML d'énormes quantités de données météorologiques jusqu'à ce qu'il apprenne la relation mathématique entre les schémas météorologiques qui produisent différentes quantités de pluie. Nous fournissons ensuite au modèle les données météorologiques actuelles, et il prédit la quantité de pluie.

Testez vos connaissances

Qu'est-ce qu'un "modèle" dans le machine learning ?
Un modèle est une relation mathématique dérivée de données qu'un système de ML utilise pour faire des prédictions.
Un modèle est un élément de matériel informatique.
Un modèle est une représentation à plus petite échelle de l'objet que vous étudiez.

Types de systèmes de ML

Les systèmes de ML appartiennent à une ou plusieurs des catégories suivantes en fonction de la façon dont ils apprennent à faire des prédictions ou à générer du contenu :

  • Apprentissage supervisé
  • Apprentissage non supervisé
  • Apprentissage par renforcement
  • IA générative

Apprentissage supervisé

Les modèles d'apprentissage supervisé peuvent faire des prédictions après avoir vu de nombreuses données avec les réponses correctes, puis découvert les liens entre les éléments des données qui produisent les réponses correctes. C'est comme si un élève apprenait de nouvelles notions en étudiant d'anciens examens contenant à la fois des questions et des réponses. Une fois que l'élève s'est entraîné sur un nombre suffisant d'anciens examens, il est bien préparé pour passer un nouvel examen. Ces systèmes de ML sont "supervisés" dans le sens où un humain fournit au système de ML des données avec les résultats corrects connus.

La régression et la classification sont deux des cas d'utilisation les plus courants de l'apprentissage supervisé.

Régression

Un modèle de régression prédit une valeur numérique. Par exemple, un modèle météorologique qui prédit la quantité de pluie en pouces ou en millimètres est un modèle de régression.

Vous trouverez d'autres exemples de modèles de régression dans le tableau ci-dessous :

Scénario Données d'entrée possibles Prédiction numérique
Prix futur de la maison Superficie, code postal, nombre de chambres et de salles de bain, superficie du terrain, taux d'intérêt hypothécaire, taux d'imposition foncière, coûts de construction et nombre de maisons à vendre dans la région. Prix de la maison.
Durée du trajet futur les conditions de circulation historiques (recueillies à partir de smartphones, de capteurs de trafic, d'applications de navigation et de covoiturage, etc.), la distance jusqu'à la destination et les conditions météorologiques. Temps en minutes et en secondes pour arriver à destination.

Classification

Les modèles de classification prédisent la probabilité qu'un élément appartienne à une catégorie. Contrairement aux modèles de régression, dont la sortie est un nombre, les modèles de classification génèrent une valeur indiquant si un élément appartient ou non à une catégorie spécifique. Par exemple, les modèles de classification sont utilisés pour prédire si un e-mail est un spam ou si une photo contient un chat.

Les modèles de classification sont divisés en deux groupes : la classification binaire et la classification multiclasse. Les modèles de classification binaire génèrent une valeur à partir d'une classe qui ne contient que deux valeurs (par exemple, un modèle qui génère rain ou no rain). Les modèles de classification multiclasse génèrent une valeur à partir d'une classe contenant plus de deux valeurs (par exemple, un modèle pouvant générer rain, hail, snow ou sleet).

Testez vos connaissances

Si vous souhaitez utiliser un modèle de ML pour prédire la consommation d'énergie des bâtiments commerciaux, quel type de modèle devez-vous utiliser ?
Régression
La consommation d'énergie est mesurée en kilowattheures (kWh), qui est un nombre. Vous devez donc utiliser un modèle de régression.
Classification
Les modèles de classification prédisent si un élément appartient ou non à une catégorie, tandis que les modèles de régression prédisent un nombre. Étant donné que la consommation d'énergie est mesurée en kilowattheures (kWh), qui est un nombre, vous devez utiliser un modèle de régression.

Apprentissage non supervisé

Les modèles d'apprentissage non supervisé effectuent des prédictions à partir de données ne contenant aucune réponse correcte. L'objectif d'un modèle d'apprentissage non supervisé est d'identifier des tendances significatives dans les données. En d'autres termes, le modèle ne reçoit aucune indication sur la façon de catégoriser chaque élément de données, mais doit inférer ses propres règles.

Un modèle d'apprentissage non supervisé couramment utilisé emploie une technique appelée clustering. Le modèle identifie les points de données qui délimitent les regroupements naturels.

Image montrant des points colorés en clusters.

Figure 1 : Un modèle de ML regroupant des points de données similaires.

Image montrant des points colorés regroupés dans une forme et se touchant.

Figure 2 : Groupes de clusters avec des limites naturelles.

Le clustering diffère de la classification, car les catégories ne sont pas définies par vous. Par exemple, un modèle non supervisé peut regrouper un ensemble de données météorologiques en fonction de la température, révélant ainsi des segmentations qui définissent les saisons. Vous pouvez ensuite essayer de nommer ces clusters en fonction de votre compréhension de l'ensemble de données.

Image montrant des points de couleur regroupés et identifiés comme neige, pluie, grêle et pas de pluie.

Figure 3. Un modèle de ML regroupant des schémas météorologiques similaires.

Image montrant des points de couleur regroupés et identifiés comme neige, pluie, grêle et pas de pluie, enfermés dans une forme et se touchant.

Figure 4. Groupes de conditions météorologiques identifiés comme neige, grésil, pluie et pas de pluie.

Testez vos connaissances

Qu'est-ce qui distingue une approche supervisée d'une approche non supervisée ?
Une approche supervisée reçoit des données contenant la bonne réponse.
Une approche supervisée reçoit des données contenant la bonne réponse. Le modèle doit trouver des liens dans les données qui produisent la bonne réponse. Une approche non supervisée reçoit des données sans la réponse correcte. Son rôle est de trouver des regroupements dans les données.
Une approche supervisée utilise généralement le clustering.
Une approche non supervisée utilise le clustering.
Une approche non supervisée sait comment étiqueter des clusters de données.
Une approche non supervisée ne sait pas ce que signifient les clusters de données. C'est à vous de les définir en fonction de votre compréhension des données.

Apprentissage par renforcement

Les modèles d'apprentissage par renforcement font des prédictions en recevant des récompenses ou des pénalités en fonction des actions effectuées dans un environnement. Un système d'apprentissage par renforcement génère une stratégie qui définit la meilleure façon d'obtenir le plus de récompenses.

L'apprentissage par renforcement est utilisé pour entraîner les robots à effectuer des tâches, comme se déplacer dans une pièce, et les logiciels comme AlphaGo à jouer au jeu de Go.

IA générative

L'IA générative est une classe de modèles qui crée du contenu à partir des saisies des utilisateurs. Par exemple, l'IA générative peut créer des images, des compositions musicales et des blagues uniques. Elle peut résumer des articles, expliquer comment effectuer une tâche ou retoucher une photo.

L'IA générative peut prendre en compte différentes entrées et créer différentes sorties, comme du texte, des images, de l'audio et des vidéos. Il peut également prendre et créer des combinaisons de ces éléments. Par exemple, un modèle peut prendre une image en entrée et créer une image et du texte en sortie, ou prendre une image et du texte en entrée et créer une vidéo en sortie.

Nous pouvons discuter des modèles génératifs en fonction de leurs entrées et sorties, généralement écrites sous la forme "type d'entrée"-vers-"type de sortie". Par exemple, voici une liste partielle d'entrées et de sorties pour les modèles génératifs :

  • Texte-vers-texte
  • Texte-vers-image
  • Texte-vers-vidéo
  • Texte-vers-code
  • Synthèse vocale
  • Image et texte-vers-image

Le tableau suivant contient des exemples de modèles génératifs, de leurs entrées et de leurs sorties possibles :

Modèle Entrée Exemple de résultat :
Texte-vers-texte Qui a inventé la course des 24 Heures du Mans ? Les 24 Heures du Mans ont été fondées par l'Automobile Club de l'Ouest (ACO), une organisation automobile fondée en 1906. La première course a eu lieu les 26 et 27 mai 1923 sur le circuit de la Sarthe, un circuit routier de 13,426 kilomètres (8,345 miles) situé près de la ville du Mans, en France. La course a été conçue à l'origine pour promouvoir l'ACO et la région de la Sarthe.
Source : Bard
Texte-vers-image Une pieuvre extraterrestre flotte à travers un portail en lisant un journal. Image d'une pieuvre de dessin animé.
Source : Imagen
Texte-vers-vidéo Un ours en peluche photoréaliste nage dans l'océan à San Francisco. L'ours en peluche est immergé. L'ours en peluche continue de nager sous l'eau avec des poissons colorés. Un panda nage sous l'eau. Vidéo d'un ours en peluche nageant sous l'eau.
Source : Phenaki
Texte-vers-code Écris une boucle Python qui parcourt une liste de nombres et affiche les nombres premiers.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Source : Bard
Image-vers-texte Image d'un flamant rose. C'est un flamant rose. On les trouve dans les Caraïbes.
Source : Google DeepMind

Comment fonctionne l'IA générative ? De manière générale, les modèles génératifs apprennent des schémas dans les données dans le but de produire de nouvelles données similaires. Voici quelques exemples de modèles génératifs :

  • Comédiens qui apprennent à imiter les autres en observant leur comportement et leur façon de parler
  • Artistes qui apprennent à peindre dans un style particulier en étudiant de nombreuses peintures de ce style
  • Groupes de reprises qui apprennent à imiter un groupe de musique spécifique en écoutant beaucoup de musique de ce groupe

Pour produire des résultats uniques et créatifs, les modèles génératifs sont d'abord entraînés à l'aide d'une approche non supervisée, où le modèle apprend à imiter les données sur lesquelles il est entraîné. Le modèle est parfois entraîné davantage à l'aide de l'apprentissage supervisé ou par renforcement sur des données spécifiques liées aux tâches qu'il peut être amené à effectuer (par exemple, résumer un article ou retoucher une photo).

L'IA générative est une technologie qui évolue rapidement et de nouveaux cas d'utilisation sont constamment découverts. Par exemple, les modèles génératifs aident les entreprises à affiner les images de leurs produits d'e-commerce en supprimant automatiquement les arrière-plans distrayants ou en améliorant la qualité des images basse résolution.