Problem verstehen

Führen Sie die folgenden Schritte aus, um das Problem zu verstehen:

  • Nennen Sie das Ziel des Produkts, das Sie entwickeln oder umstrukturieren.
  • Entscheiden Sie, ob das Ziel am besten mithilfe von prädiktiver ML, generativer KI oder einer Lösung ohne ML erreicht werden kann.
  • Prüfen Sie, ob Sie die erforderlichen Daten zum Trainieren eines Modells haben, wenn Sie einen Ansatz für die Prognose mithilfe von ML verwenden.

Ziel formulieren

Formulieren Sie Ihr Ziel zuerst in nicht-ML-Begriffen. Das Ziel ist die Antwort auf die Frage: „Was möchte ich erreichen?“

In der folgenden Tabelle sind die Ziele für hypothetische Apps klar formuliert:

Anwendung Goal
Wetter App Niederschlagsmengen für eine Region in sechsstündigen Intervallen berechnen.
Mode-App Verschiedene T-Shirt-Designs erstellen
Video-App Empfehlen Sie nützliche Videos.
E-Mail-App Spam erkennen
Finanz-App Finanzinformationen aus mehreren Nachrichtenquellen zusammenfassen
Karten-App Reisezeit berechnen
Banking-App Betrügerische Transaktionen erkennen
Restaurant-App Die Küche anhand der Speisekarte eines Restaurants identifizieren.
E-Commerce-App Antworten Sie auf Rezensionen mit hilfreichen Antworten.

Klarer Anwendungsfall für maschinelles Lernen

Einige betrachten ML als universelles Tool, das auf alle Probleme angewendet werden kann. In Wirklichkeit ist ML ein spezielles Tool, das nur für bestimmte Probleme geeignet ist. Sie sollten keine komplexe ML-Lösung implementieren, wenn eine einfachere Lösung ohne ML ausreicht.

ML-Systeme lassen sich in zwei große Kategorien unterteilen: Prädiktive ML und generative KI. In der folgenden Tabelle sind ihre Merkmale aufgeführt:

Eingabe Ausgabe Trainingstechnik
Prognoseorientierte ML Text
Bild
Audio
Video
Numerisch
Erstellen einer Vorhersage, z. B. Klassifizierung einer E-Mail als Spam oder Nicht-Spam, Schätzung der Regenmenge für morgen oder Vorhersage des Aktienkurses Die Ausgabe kann in der Regel anhand der Realität überprüft werden. Hier werden in der Regel viele Daten verwendet, um ein Modell für überwachtes, unbeaufsichtigtes oder bestärkendes Lernen zu trainieren, um eine bestimmte Aufgabe auszuführen.
Generative AI Text
Bild
Audio
Video
Numerisch
Er generiert eine Ausgabe basierend auf der Absicht des Nutzers, z. B. einen Artikel zusammenfasst oder einen Audioclip oder ein kurzes Video erstellt. In der Regel werden viele unlabelte Daten verwendet, um ein großes Sprachmodell oder einen Bildgenerator zu trainieren, um fehlende Daten zu ergänzen. Das Modell kann dann für Aufgaben verwendet werden, die als Lückentextaufgaben formuliert werden können. Es kann auch optimiert werden, indem es mit Labels für eine bestimmte Aufgabe wie die Klassifizierung trainiert wird.

Um festzustellen, ob maschinelles Lernen der richtige Ansatz ist, sollten Sie zuerst prüfen, ob Ihre aktuelle Lösung ohne maschinelles Lernen optimiert ist. Wenn Sie keine Lösung ohne ML implementiert haben, versuchen Sie, das Problem manuell mithilfe einer Heuristik zu lösen.

Die Lösung ohne ML ist der Benchmark, anhand dessen Sie feststellen, ob ML für Ihr Problem geeignet ist. Berücksichtigen Sie die folgenden Fragen, wenn Sie einen Ansatz ohne maschinelles Lernen mit einem Ansatz mit maschinellem Lernen vergleichen:

  • Qualität Wie viel besser kann eine ML-Lösung Ihrer Meinung nach sein? Wenn Sie der Meinung sind, dass eine ML-Lösung nur eine kleine Verbesserung darstellt, ist die aktuelle Lösung möglicherweise die beste.

  • Kosten und Wartung Wie teuer ist die ML-Lösung sowohl kurzfristig als auch langfristig? In einigen Fällen ist die Implementierung von ML in Bezug auf Rechenressourcen und Zeit deutlich aufwendiger. Berücksichtigen Sie dabei folgende Fragen:

    • Kann die ML-Lösung die Kostensteigerung rechtfertigen? Kleine Verbesserungen bei großen Systemen können die Kosten und die Wartung einer ML-Lösung leicht rechtfertigen.
    • Wie viel Wartung erfordert die Lösung? In vielen Fällen erfordern ML-Implementierungen eine spezielle langfristige Wartung.
    • Verfügt Ihr Produkt über die Ressourcen, um Mitarbeiter mit ML-Kenntnissen zu schulen oder einzustellen?

Wissen testen

Warum ist es wichtig, vor der Analyse einer ML-Lösung eine Lösung ohne maschinelles Lernen oder eine Heuristik zu haben?
Eine Lösung ohne ML ist der Benchmark, an dem eine ML-Lösung gemessen wird.
Nicht-ML-Lösungen helfen Ihnen dabei, die Kosten einer ML-Lösung zu ermitteln.

Prognosemodelle und Daten

Daten sind die treibende Kraft des prädiktiven ML. Für gute Vorhersagen benötigen Sie Daten, die Features mit Prognosekraft enthalten. Ihre Daten sollten die folgenden Eigenschaften haben:

  • Reichlich vorhanden. Je mehr relevante und nützliche Beispiele in Ihrem Dataset enthalten sind, desto besser ist Ihr Modell.

  • Konsistent und zuverlässig Wenn Daten konsistent und zuverlässig erfasst werden, lässt sich ein besseres Modell erstellen. Ein ML-basiertes Wettermodell profitiert beispielsweise von Daten, die über viele Jahre mit denselben zuverlässigen Instrumenten erfasst wurden.

  • Vertrauenswürdig. Woher stammen die Daten? Stammen die Daten aus vertrauenswürdigen Quellen, die Sie kontrollieren, z. B. Protokollen aus Ihrem Produkt, oder aus Quellen, über die Sie nicht viel wissen, z. B. der Ausgabe eines anderen ML-Systems?

  • Verfügbar Achten Sie darauf, dass alle Eingaben zur Vorhersagezeit im richtigen Format verfügbar sind. Wenn es schwierig ist, bestimmte Featurewerte zum Zeitpunkt der Vorhersage zu erhalten, lassen Sie diese Features aus Ihren Datasets aus.

  • Korrekt. Bei großen Datasets ist es unvermeidlich, dass einige Labels falsche Werte haben. Wenn jedoch mehr als ein kleiner Prozentsatz der Labels falsch ist, liefert das Modell schlechte Vorhersagen.

  • Repräsentativ. Die Datensätze sollten möglichst repräsentativ für die reale Welt sein. Mit anderen Worten: Die Datensätze sollten die Ereignisse, das Nutzerverhalten und/oder die Phänomene der realen Welt, die modelliert werden, genau widerspiegeln. Das Training mit nicht repräsentativen Datasets kann zu einer schlechten Leistung führen, wenn das Modell reale Vorhersagen treffen soll.

Wenn Sie die benötigten Daten nicht im erforderlichen Format erhalten, macht Ihr Modell schlechte Vorhersagen.

Prognosekraft

Damit ein Modell gute Vorhersagen treffen kann, sollten die Merkmale in Ihrem Dataset eine Vorhersagekraft haben. Je stärker ein Feature mit einem Label korreliert ist, desto wahrscheinlicher ist es, dass es vorhergesagt wird.

Einige Funktionen sind präziserer als andere. In einem Wetterdatensatz wären beispielsweise Features wie cloud_coverage, temperature und dew_point bessere Vorhersagen für Regen als moon_phase oder day_of_week. Im Beispiel der Video-App könnten Sie vermuten, dass Funktionen wie video_description, length und views gute Prädiktoren dafür sind, welche Videos sich ein Nutzer ansehen möchte.

Es kann zeitaufwendig sein, herauszufinden, welche Funktionen eine Vorhersagekraft haben. Sie können die Vorhersagekraft eines Features manuell untersuchen, indem Sie es beim Trainieren eines Modells entfernen und wieder hinzufügen. Sie können die Vorhersagekraft einer Funktion mithilfe von Algorithmen wie der Pearson-Korrelation, der angepassten gegenseitigen Information (AMI) und dem Shapley-Wert automatisieren. Diese bieten eine numerische Bewertung zur Analyse der Vorhersagekraft einer Funktion.

Wissen testen

Auf welche drei wichtigen Attribute sollten Sie bei der Analyse Ihrer Datensätze achten?
Enthält korrekte Werte.
Sie müssen klein genug sein, um auf einen lokalen Computer geladen zu werden.
Sie stammen aus einer Vielzahl unvorhersehbarer Quellen.
Die Features haben eine Vorhersagekraft für das Label.
Sie müssen der Realität entsprechen.

Weitere Informationen zur Analyse und Vorbereitung von Datasets finden Sie unter Datenvorbereitung und Feature Engineering für maschinelles Lernen.

Vorhersagen und Aktionen

Es hat keinen Wert, etwas vorherzusagen, wenn Sie die Vorhersage nicht in eine Aktion umwandeln können, die Nutzern hilft. Das Produkt sollte also auf die Ausgabe des Modells reagieren.

Ein Modell, das beispielsweise vorhersagt, ob ein Nutzer ein Video nützlich finden wird, sollte in eine App einfließen, die nützliche Videos empfiehlt. Ein Modell, das vorhersagt, ob es regnen wird, sollte in eine Wetter-App einfließen.

Wissen testen

Entscheiden Sie anhand des folgenden Szenarios, ob die Verwendung von ML der beste Ansatz für das Problem ist.

Ein Entwicklerteam in einem großen Unternehmen ist für die Verwaltung eingehender Anrufe verantwortlich.

Ziel: Anrufer darüber informieren, wie lange sie bei der aktuellen Anrufanzahl in der Warteschleife warten müssen.

Er hat keine Lösung, aber er denkt, dass eine Heuristik darin bestehen könnte, die aktuelle Anzahl der in der Warteschleife befindlichen Kunden durch die Anzahl der Mitarbeiter zu teilen, die ans Telefon gehen, und dann mit 10 Minuten zu multiplizieren. Sie weiß jedoch, dass bei einigen Kunden die Probleme in zwei Minuten gelöst werden, während es bei anderen bis zu 45 Minuten oder länger dauern kann.

Mit ihrer Heuristik wird sie wahrscheinlich keine ausreichend genaue Zahl erhalten. Er kann ein Dataset mit den folgenden Spalten erstellen: number_of_callcenter_phones, user_issue, time_to_resolve, call_time und time_on_hold.

Verwenden Sie KI. Das Entwicklungsteam hat ein klar definiertes Ziel. Die Heuristik ist für den Anwendungsfall nicht gut genug. Der Datensatz enthält offenbar Vorhersagemerkmale für das Label time_on_hold.
Verwenden Sie keine KI. Obwohl er ein klar definiertes Ziel hat, sollte er zuerst eine Lösung ohne maschinelles Lernen implementieren und optimieren. Außerdem enthält sein Datensatz offenbar nicht genügend Funktionen mit Prognosekraft.