Was ist maschinelles Lernen?

Maschinelles Lernen (ML) bildet die Grundlage einiger der wichtigsten Technologien, die wir nutzen, von Übersetzungsanwendungen bis hin zu autonomen Fahrzeugen. In diesem Kurs werden die Kernkonzepte von ML erklärt.

ML bietet eine neue Möglichkeit, Probleme zu lösen, komplexe Fragen zu beantworten und neue Inhalte zu erstellen. ML kann das Wetter vorhersagen, Fahrtzeiten schätzen, Songs empfehlen, Sätze automatisch vervollständigen, Artikel zusammenfassen und Bilder generieren, die nie zuvor gesehen wurden.

Im Grunde ist ML der Prozess des Trainierens einer Software, auch model genannt, um nützliche Vorhersagen zu treffen oder Inhalte aus Daten zu generieren.

Angenommen, wir möchten eine App zur Vorhersage von Niederschlag erstellen. Wir können entweder einen traditionellen Ansatz oder einen ML-Ansatz verwenden. Mit einem traditionellen Ansatz würden wir eine physikbasierte Darstellung der Erdatmosphäre und -oberfläche erstellen und riesige Mengen von Fluiddynamikgleichungen berechnen. Das ist unglaublich schwierig.

Mit einem ML-Ansatz würden wir einem ML-Modell enorme Mengen an Wetterdaten zur Verfügung stellen, bis das ML-Modell schließlich die mathematische Beziehung zwischen Wettermustern, die unterschiedliche Regenmengen erzeugen, erlernt hat. Wir würden dem Modell dann die aktuellen Wetterdaten geben und es würde die Regenmenge vorhersagen.

Wissensstand überprüfen

Was ist ein „Modell“ im maschinellen Lernen?
Ein Modell ist eine mathematische Beziehung, die aus Daten abgeleitet wird, die ein ML-System für Vorhersagen verwendet
Ein Modell ist eine Computerhardware
Ein Modell ist eine kleinere Darstellung des Gegenstands, den Sie untersuchen.

Arten von ML-Systemen

ML-Systeme lassen sich je nachdem, wie sie lernen, Vorhersagen zu treffen oder Inhalte zu generieren, einer oder mehreren der folgenden Kategorien zuordnen:

  • Beaufsichtigtes Lernen
  • Unbeaufsichtigtes Lernen
  • Reinforcement Learning
  • Generative KI

Beaufsichtigtes Lernen

Modelle für überwachtes Lernen können Vorhersagen treffen, nachdem viele Daten mit den richtigen Antworten angezeigt wurden und dann die Verbindungen zwischen den Elementen in den Daten erkannt wurden, die die richtigen Antworten liefern. Das ist wie ein Teilnehmer, der neue Materialien erlernt, indem er alte Prüfungen durchgeht, die sowohl Fragen als auch Antworten enthalten. Sobald der Student ausreichend alte Prüfungen absolviert hat, ist er gut auf eine neue Prüfung vorbereitet. Diese ML-Systeme sind in dem Sinne „überwacht“, dass ein Mensch dem ML-System Daten mit den bekanntermaßen korrekten Ergebnissen liefert.

Zwei der häufigsten Anwendungsfälle für überwachtes Lernen sind Regression und Klassifizierung.

Regression

Ein Regressionsmodell sagt einen numerischen Wert vorher. Ein Wettermodell, das die Regenmenge in Zoll oder Millimeter vorhersagt, ist beispielsweise ein Regressionsmodell.

In der folgenden Tabelle finden Sie weitere Beispiele für Regressionsmodelle:

Szenario Mögliche Eingabedaten Numerische Vorhersage
Zukünftiger Hauspreis Quadratmeterzahl, Postleitzahl, Anzahl der Schlafzimmer und Badezimmer, Grundstücksgröße, Hypothekenzinssatz, Grundsteuersatz, Baukosten und Anzahl der zum Verkauf stehenden Häuser in der Gegend. Der Preis der Immobilie.
Zukünftige Fahrzeit Verlauf der Verkehrslage (erfasst von Smartphones, Verkehrssensoren, Mitfahrgelegenheiten und anderen Navigationsanwendungen), Entfernung zum Ziel und Wetterbedingungen. Die Zeit in Minuten und Sekunden bis zur Ankunft an einem Ziel.

Klassifizierung

Klassifizierungsmodelle sagen die Wahrscheinlichkeit voraus, dass etwas zu einer Kategorie gehört. Im Gegensatz zu Regressionsmodellen, deren Ausgabe eine Zahl ist, geben Klassifizierungsmodelle einen Wert aus, der angibt, ob etwas zu einer bestimmten Kategorie gehört oder nicht. Klassifizierungsmodelle werden beispielsweise verwendet, um vorherzusagen, ob es sich bei einer E-Mail um Spam handelt oder ob ein Foto eine Katze enthält.

Klassifizierungsmodelle werden in zwei Gruppen unterteilt: binäre Klassifizierung und mehrklassige Klassifizierung. Binäre Klassifizierungsmodelle geben einen Wert von einer Klasse aus, die nur zwei Werte enthält, z. B. ein Modell, das entweder rain oder no rain ausgibt. Klassifizierungsmodelle mit mehreren Klassen geben einen Wert von einer Klasse aus, die mehr als zwei Werte enthält, z. B. ein Modell, das entweder rain, hail, snow oder sleet ausgeben kann.

Wissensstand überprüfen

Wenn Sie ein ML-Modell verwenden möchten, um den Energieverbrauch in Gewerbegebäuden vorherzusagen, welche Art von Modell würden Sie verwenden?
Regression
Der Energieverbrauch wird in Kilowattstunden (kWh) gemessen, einer Zahl. Daher empfiehlt es sich, ein Regressionsmodell zu verwenden.
Klassifizierung
Klassifizierungsmodelle sagen voraus, ob etwas zu einer Kategorie gehört, während Regressionsmodelle eine Zahl vorhersagen. Da der Energieverbrauch in Kilowattstunden (kWh) gemessen wird, also einer Zahl, eignet sich ein Regressionsmodell.

Unbeaufsichtigtes Lernen

Modelle für unüberwachtes Lernen treffen Vorhersagen, indem sie Daten erhalten, die keine richtigen Antworten enthalten. Das Ziel eines Modells für unüberwachtes Lernen besteht darin, sinnvolle Muster in den Daten zu identifizieren. Mit anderen Worten: Das Modell hat keine Hinweise darauf, wie die einzelnen Daten kategorisiert werden sollen, sondern muss stattdessen eigene Regeln ableiten.

Ein häufig verwendetes Modell für unüberwachtes Lernen verwendet die sogenannte Clustering-Technik. Das Modell findet Datenpunkte, die natürliche Gruppierungen abgrenzen.

Ein Bild mit farbigen Punkten in Clustern.

Abbildung 1. Ein ML-Modell, das ähnliche Datenpunkte gruppiert.

Ein Bild mit farbigen Punkten in Clustern, die in einer Form umrandet sind.

Abbildung 2. Gruppen von Clustern mit natürlichen Abgrenzungen.

Clustering unterscheidet sich von der Klassifizierung, da die Kategorien nicht von Ihnen definiert werden. Ein unbeaufsichtigtes Modell könnte beispielsweise ein Wetter-Dataset auf Basis der Temperatur gruppieren und Segmentierungen zur Definition der Jahreszeiten aufdecken. Sie können dann versuchen, diese Cluster nach Ihrem Verständnis des Datasets zu benennen.

Ein Bild mit farbigen Punkten in Clustern, die als „Schnee“, „Regen“, „Hagel“ oder „Kein Regen“ bezeichnet sind.

Abbildung 3. Ein ML-Modell, das ähnliche Wettermuster gruppiert.

Ein Bild mit farbigen Punkten in Clustern, die als „Schnee“, „Regen“, „Hagel“ und „Kein Regen“ bezeichnet sind, in einer Form umschlossen und aneinandergrenzen.

Abbildung 4. Wetterlagen, die als Schnee, Graupel, Regen und kein Regen gekennzeichnet sind.

Wissensstand überprüfen

Was unterscheidet einen überwachten von einem nicht überwachten Ansatz?
Bei einem überwachten Ansatz werden Daten bereitgestellt, die die richtige Antwort enthalten.
Bei einem überwachten Ansatz werden Daten bereitgestellt, die die richtige Antwort enthalten. Die Aufgabe des Modells besteht darin, Verbindungen in den Daten zu finden, die die richtige Antwort liefern. Bei einem unüberwachten Ansatz werden Daten ohne die richtige Antwort ausgegeben. Seine Aufgabe ist es, Gruppierungen in den Daten zu finden.
Bei einem überwachten Ansatz wird in der Regel Clustering verwendet.
Bei einem unbeaufsichtigten Ansatz wird Clustering verwendet.
Bei einem unüberwachten Ansatz können Datencluster mit Labels versehen werden.
Bei einem unüberwachten Ansatz ist nicht bekannt, was die Datencluster bedeuten. Basierend auf Ihrem Verständnis der Daten liegt es an Ihnen, diese zu definieren.

Reinforcement Learning

Modelle für bestärkendes Lernen treffen Vorhersagen, indem sie Prämien oder Strafen basierend auf Aktionen erhalten, die in einer Umgebung ausgeführt werden. Ein bestärkendes Lernsystem generiert eine Richtlinie, die die beste Strategie für die meisten Belohnungen definiert.

Bestärkendes Lernen wird verwendet, um Roboter für Aufgaben wie das Gehen durch einen Raum und Softwareprogramme wie AlphaGo zum Spielen von Go zu trainieren.

Generative KI

Generative AI ist eine Klasse von Modellen, die Inhalte aus Nutzereingaben erstellen. Generative AI kann beispielsweise einzigartige Bilder, Musikkompositionen und Witze erstellen, Artikel zusammenfassen, erklären, wie eine Aufgabe ausgeführt wird, oder ein Foto bearbeiten.

Generative AI kann eine Vielzahl von Eingaben und Ausgaben wie Text, Bilder, Audio und Video erstellen. Sie kann auch Kombinationen daraus erstellen. Ein Modell kann beispielsweise ein Bild als Eingabe verwenden und ein Bild und Text als Ausgabe erstellen oder ein Bild und Text als Eingabe verwenden und ein Video als Ausgabe erstellen.

Wir können generative Modelle anhand ihrer Eingaben und Ausgaben besprechen, die in der Regel als „Eingabetyp“ in „Ausgabetyp“ geschrieben werden. Im Folgenden finden Sie beispielsweise eine unvollständige Liste einiger Ein- und Ausgaben für generative Modelle:

  • Text-in-Text
  • Text-zu-Bild
  • Text-zu-Video
  • Text-in-Code
  • Sprachausgabe
  • Bild und Text-zu-Bild

Die folgende Tabelle enthält Beispiele für generative Modelle, deren Eingabe und ein Beispiel für ihre mögliche Ausgabe:

Modell Eingabe Beispielausgabe
Text-in-Text Wer hat das Rennen von Le Mans erfunden? Der 24 Stunden von Le Mans wurde vom Automobile Club de l'Ouest (ACO) gegründet, einem 1906 gegründeten Automobilverband. Das erste Rennen wurde am 26. und 27. Mai 1923 auf der 13.426 km langen Rennstrecke Sarthe in der Nähe der französischen Stadt Le Mans abgehalten. Ursprünglich sollte das Rennen die ACO und die Region Sarthe bewerben.
Quelle: Bard
Text-zu-Bild Ein Außerirdischer schwebt durch ein Portal und liest eine Zeitung. Bild eines gezeichneten Tintenfischs.
Quelle: Imagen
Text-zu-Video Ein fotorealistischer Teddybär schwimmt in San Francisco im Meer. Der Teddybär taucht unter Wasser. Der Teddybär schwimmt mit bunten Fischen unter dem Wasser. Ein Pandabär schwimmt unter Wasser. Video eines Teddybären, der unter Wasser schwimmt.
Quelle: Phenaki
Text-in-Code Schreiben Sie eine Python-Schleife, die eine Liste von Zahlen als Schleife durchläuft und die Primzahlen ausgibt.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Quelle: Bard
Bild-zu-Text Bild eines Flamingos. Das ist ein Flamingo. Sie sind in der Karibik zu finden.
Quelle: Google DeepMind

Wie funktioniert Generative AI? Im Allgemeinen lernen generative Modelle Muster in Daten mit dem Ziel, neue, aber ähnliche Daten zu erzeugen. Generative Modelle sehen so aus:

  • Komiker, die lernen, andere zu imitieren, indem sie das Verhalten und die Art des Sprechens
  • Künstler, die viele Malereien in einem bestimmten Stil studieren,
  • Coverbands, die lernen, wie eine bestimmte Musikgruppe zu klingen, indem sie viel Musik dieser Gruppe hören

Generative Modelle werden anfangs unüberwacht trainiert, um einzigartige und kreative Ausgaben zu generieren. Dabei lernt das Modell, die Daten zu imitieren, mit denen es trainiert wird. Manchmal wird das Modell mithilfe von überwachtem oder verstärkendem Lernen anhand bestimmter Daten im Zusammenhang mit Aufgaben trainiert, die das Modell ausführen soll, z. B. um einen Artikel zusammenzufassen oder ein Foto zu bearbeiten.

Generative AI ist eine sich schnell weiterentwickelnde Technologie und es werden ständig neue Anwendungsfälle erschlossen. Generative Modelle helfen beispielsweise Unternehmen, ihre E-Commerce-Produktbilder zu optimieren, indem ablenkende Hintergründe automatisch entfernt oder die Qualität von Bildern mit niedriger Auflösung verbessert wird.