Comprendre le problème

Pour comprendre le problème, procédez comme suit:

  • Indiquez l'objectif du produit que vous développez ou refactorisez.
  • Déterminez si l'objectif est mieux atteint à l'aide du ML prédictif, de l'IA générative ou d'une solution autre que le ML.
  • Vérifiez que vous disposez des données requises pour entraîner un modèle si vous utilisez une approche de ML prédictif.

Définir l'objectif

Commencez par définir votre objectif en termes non liés au ML. L'objectif est la réponse à la question "Qu'est-ce que j'essaie d'accomplir ?".

Le tableau suivant indique clairement les objectifs d'applications hypothétiques:

Application Objectif
Application Météo Calculez les précipitations par tranche de six heures pour une région géographique.
Application de mode Générez différentes conceptions de chemises.
Application vidéo Recommandez des vidéos utiles.
Application Mail Détecter le spam
Application financière Résumer des informations financières provenant de plusieurs sources d'actualités
Cartes Calculez le temps de trajet.
Application bancaire Identifier les transactions frauduleuses
Application de restauration Identifier la cuisine à partir du menu d'un restaurant
Application d'e-commerce Répondez aux avis en fournissant des réponses utiles.

Cas d'utilisation clair du ML

Certains considèrent le ML comme un outil universel qui peut être appliqué à tous les problèmes. En réalité, le ML est un outil spécialisé qui ne convient qu'à des problèmes particuliers. Vous ne voulez pas implémenter une solution de ML complexe alors qu'une solution non ML plus simple peut fonctionner.

Les systèmes de ML peuvent être divisés en deux grandes catégories : le ML prédictif et l'IA générative. Le tableau suivant présente leurs caractéristiques:

Entrée Sortie Technique d'entraînement
ML prédictif Texte
Image
Audio
Vidéo
Numérique
Effectue une prédiction, par exemple en classant un e-mail comme spam ou non, en devinant la quantité de pluie attendue demain ou en prédisant le prix d'une action. Le résultat peut généralement être comparé à la réalité. Utilise généralement beaucoup de données pour entraîner un modèle d'apprentissage supervisé, non supervisé ou par renforcement afin d'effectuer une tâche spécifique.
Generative AI Texte
Image
Audio
Vidéo
Numérique
Génère une sortie en fonction de l'intention de l'utilisateur, par exemple en résumant un article, ou en produisant un extrait audio ou une courte vidéo. Utilise généralement de nombreuses données non étiquetées pour entraîner un grand modèle de langage ou un générateur d'images afin de combler les données manquantes. Le modèle peut ensuite être utilisé pour des tâches qui peuvent être présentées sous forme de tâches à compléter ou être affiné en l'entraînant sur des données libellées pour une tâche spécifique, comme la classification.

Pour vous assurer que le ML est la bonne approche, vérifiez d'abord que votre solution actuelle sans ML est optimisée. Si vous n'avez pas implémenté de solution non ML, essayez de résoudre le problème manuellement à l'aide d'une heuristique.

La solution non ML est le benchmark que vous utiliserez pour déterminer si le ML est un bon cas d'utilisation pour votre problème. Posez-vous les questions suivantes lorsque vous comparez une approche non ML à une approche ML:

  • Qualité Selon vous, dans quelle mesure une solution de ML peut-elle être meilleure ? Si vous pensez qu'une solution de ML ne peut apporter qu'une petite amélioration, cela peut indiquer que la solution actuelle est la meilleure.

  • Coût et maintenance Quelle est la rentabilité de la solution de ML à court et à long terme ? Dans certains cas, l'implémentation du ML coûte beaucoup plus cher en termes de ressources de calcul et de temps. Posez-vous les questions suivantes :

    • La solution de ML peut-elle justifier l'augmentation des coûts ? Notez que de petites améliorations dans de grands systèmes peuvent facilement justifier le coût et la maintenance de l'implémentation d'une solution de ML.
    • Quelle maintenance la solution nécessitera-t-elle ? Dans de nombreux cas, les implémentations de ML nécessitent une maintenance dédiée à long terme.
    • Votre produit dispose-t-il des ressources nécessaires pour former ou embaucher des personnes ayant une expertise en ML ?

Testez vos connaissances

Pourquoi est-il important de disposer d'une solution ou d'une heuristique non ML avant d'analyser une solution ML ?
Une solution non ML est le benchmark à utiliser pour mesurer une solution de ML.
Les solutions autres que le ML vous aident à déterminer le coût d'une solution de ML.

ML prédictif et données

Les données sont le moteur du ML prédictif. Pour effectuer de bonnes prédictions, vous avez besoin de données contenant des caractéristiques avec une puissance prédictive. Vos données doivent présenter les caractéristiques suivantes:

  • Abondante Plus votre ensemble de données contient d'exemples pertinents et utiles, meilleur sera votre modèle.

  • Cohérentes et fiables Des données collectées de manière cohérente et fiable permettent de produire un meilleur modèle. Par exemple, un modèle météorologique basé sur l'apprentissage automatique bénéficiera des données collectées pendant de nombreuses années à partir des mêmes instruments fiables.

  • Confiance Identifier la source de vos données Les données proviendront-elles de sources fiables que vous contrôlez, comme les journaux de votre produit, ou de sources sur lesquelles vous n'avez pas beaucoup d'informations, comme la sortie d'un autre système de ML ?

  • Disponible Assurez-vous que toutes les entrées sont disponibles au moment de la prédiction au bon format. Si l'obtention de certaines valeurs de caractéristiques au moment de la prédiction est difficile, omettez ces caractéristiques de vos ensembles de données.

  • Bonne réponse. Dans les grands ensembles de données, il est inévitable que certaines étiquettes aient des valeurs incorrectes, mais si plus d'un petit pourcentage d'étiquettes sont incorrectes, le modèle produira de mauvaises prédictions.

  • Représentatif Les ensembles de données doivent être aussi représentatifs du monde réel que possible. En d'autres termes, les ensembles de données doivent refléter avec précision les événements, les comportements des utilisateurs et/ou les phénomènes du monde réel modélisés. L'entraînement sur des ensembles de données non représentatifs peut entraîner de mauvaises performances lorsque le modèle est invité à effectuer des prédictions dans le monde réel.

Si vous ne parvenez pas à obtenir les données dont vous avez besoin au format requis, votre modèle produira de mauvaises prédictions.

Puissance prédictive

Pour qu'un modèle puisse effectuer de bonnes prédictions, les caractéristiques de votre ensemble de données doivent avoir une puissance prédictive. Plus une caractéristique est corrélée à une étiquette, plus elle est susceptible de la prédire.

Certaines caractéristiques auront plus de pouvoir prédictif que d'autres. Par exemple, dans un ensemble de données météorologiques, des caractéristiques telles que cloud_coverage, temperature et dew_point seraient de meilleurs prédicteurs de la pluie que moon_phase ou day_of_week. Pour l'exemple d'application vidéo, vous pouvez émettre l'hypothèse que des fonctionnalités telles que video_description, length et views peuvent être de bons prédicteurs des vidéos qu'un utilisateur souhaite regarder.

Déterminer quelles caractéristiques ont une capacité prédictive peut être un processus long. Vous pouvez explorer manuellement la puissance prédictive d'une fonctionnalité en la supprimant et en l'ajoutant lors de l'entraînement d'un modèle. Vous pouvez automatiser la recherche de la puissance prédictive d'une fonctionnalité à l'aide d'algorithmes tels que la corrélation de Pearson, l'information mutuelle ajustée (AMI) et la valeur Shapley, qui fournissent une évaluation numérique pour analyser la puissance prédictive d'une fonctionnalité.

Testez vos connaissances

Lorsque vous analysez vos ensembles de données, quels sont les trois attributs clés que vous devez rechercher ?
Représentatif du monde réel.
Contient des valeurs correctes.
Les caractéristiques ont un pouvoir prédictif pour l'étiquette.
suffisamment petite pour être chargée sur un ordinateur local ;
Recueillies à partir de diverses sources imprévisibles.

Pour en savoir plus sur l'analyse et la préparation de vos ensembles de données, consultez Préparation des données et ingénierie des caractéristiques pour le machine learning.

Prédictions par rapport aux actions

Il n'y a aucun intérêt à prédire quelque chose si vous ne pouvez pas transformer cette prédiction en action qui aide les utilisateurs. Autrement dit, votre produit doit prendre des mesures à partir de la sortie du modèle.

Par exemple, un modèle qui prédit si un utilisateur trouvera une vidéo utile doit être intégré à une application qui recommande des vidéos utiles. Un modèle qui prédit s'il va pleuvoir doit être alimenté par une application météo.

Testez vos connaissances

Sur la base du scénario suivant, déterminez si l'utilisation du ML est la meilleure approche pour résoudre le problème.

Une équipe d'ingénieurs d'une grande entreprise est chargée de gérer les appels téléphoniques entrants.

Objectif: informer les appelants du temps d'attente en fonction du volume d'appels actuel.

Il n'a pas de solution en place, mais il pense qu'une heuristique consisterait à diviser le nombre actuel de clients en attente par le nombre d'employés qui répondent au téléphone, puis à multiplier le résultat par 10 minutes. Toutefois, il sait que certains clients voient leur problème résolu en deux minutes, tandis que d'autres peuvent attendre jusqu'à 45 minutes ou plus.

Leur heuristique ne leur donnera probablement pas un nombre suffisamment précis. Il peut créer un ensemble de données avec les colonnes suivantes : number_of_callcenter_phones, user_issue, time_to_resolve, call_time et time_on_hold.

Utilisez le ML. L'équipe d'ingénieurs a un objectif clairement défini. Son heuristique ne sera pas assez bonne pour son cas d'utilisation. L'ensemble de données semble comporter des fonctionnalités prédictives pour le libellé time_on_hold.
N'utilisez pas le ML. Bien qu'il ait un objectif clairement défini, il doit d'abord implémenter et optimiser une solution non ML. De plus, son ensemble de données ne semble pas contenir suffisamment de fonctionnalités avec une capacité prédictive.