Was ist maschinelles Lernen?

Maschinelles Lernen (ML) ist die Grundlage einiger der wichtigsten Technologien, die wir nutzen, von Übersetzungs-Apps bis hin zu autonomen Fahrzeugen. In diesem Kurs werden die grundlegenden Konzepte der ML erläutert.

ML bietet eine neue Möglichkeit, Probleme zu lösen, komplexe Fragen zu beantworten und neue Inhalte zu erstellen. Mithilfe von ML lassen sich das Wetter vorhersagen, Fahrtzeiten schätzen, Songs empfehlen, Sätze automatisch vervollständigen, Artikel zusammenfassen und noch nie gesehene Bilder generieren.

Im Grunde genommen ist maschinelles Lernen der Prozess, bei dem eine Software, ein sogenanntes Modell, trainiert wird, um nützliche Vorhersagen zu treffen oder Inhalte aus Daten zu generieren.

Angenommen, wir möchten eine App erstellen, mit der Regen vorhergesagt werden kann. Wir könnten entweder einen traditionellen Ansatz oder einen ML-Ansatz verwenden. Mit einem herkömmlichen Ansatz würden wir eine physikbasierte Darstellung der Atmosphäre und Oberfläche der Erde erstellen und dabei eine enorme Menge an Gleichungen zur Strömungsmechanik berechnen. Das ist unglaublich schwierig.

Bei einem ML-Ansatz würden wir einem ML-Modell enorme Mengen an Wetterdaten zuführen, bis es die mathematische Beziehung zwischen Wettermustern, die unterschiedliche Niederschlagsmengen verursachen, gelernt hat. Wir geben dem Modell dann die aktuellen Wetterdaten und es prognostiziert die Regenmenge.

Wissen testen

Was ist ein „Modell“ im Bereich maschinelles Lernen?
Ein Modell ist eine mathematische Beziehung, die aus Daten abgeleitet wird, die ein ML-System für Vorhersagen verwendet.
Ein Modell ist ein Computer
Ein Modell ist eine kleinere Darstellung des untersuchten Objekts.

Arten von ML-Systemen

ML-Systeme fallen in eine oder mehrere der folgenden Kategorien, je nachdem, wie sie lernen, Vorhersagen zu treffen oder Inhalte zu generieren:

  • Beaufsichtigtes Lernen
  • Unbeaufsichtigtes Lernen
  • Reinforcement Learning
  • Generative KI

Beaufsichtigtes Lernen

Modelle für das überwachte Lernen können Vorhersagen treffen, nachdem sie viele Daten mit den richtigen Antworten gesehen und dann die Verbindungen zwischen den Elementen in den Daten gefunden haben, die die richtigen Antworten liefern. Das ist vergleichbar mit einem Schüler oder Studenten, der sich neues Wissen aneignet, indem er sich alte Prüfungen ansieht, die sowohl Fragen als auch Antworten enthalten. Sobald der Schüler oder Student an genügend alten Prüfungen trainiert hat, ist er gut auf eine neue Prüfung vorbereitet. Diese ML-Systeme sind insofern „überwacht“, als ein Mensch dem ML-System Daten mit den bekannten korrekten Ergebnissen zur Verfügung stellt.

Zwei der häufigsten Anwendungsfälle für überwachtes Lernen sind Regression und Klassifizierung.

Regression

Mit einem Regressionsmodell lassen sich numerische Werte vorhersagen. Ein Wettermodell, das die Regenmenge in Zentimetern oder Millimetern vorhersagt, ist beispielsweise ein Regressionsmodell.

Weitere Beispiele für Regressionsmodelle finden Sie in der folgenden Tabelle:

Szenario Mögliche Eingabedaten Numerische Vorhersage
Zukünftiger Hauspreis Wohnfläche, Postleitzahl, Anzahl der Schlafzimmer und Badezimmer, Grundstücksgröße, Hypothekenzinssatz, Grundsteuersatz, Baukosten und Anzahl der zum Verkauf stehenden Häuser in der Region. Der Preis des Hauses.
Zukünftige Fahrtzeit Bisherige Verkehrsbedingungen (erfasst von Smartphones, Verkehrssensoren, Fahrdienst- und anderen Navigationsanwendungen), Entfernung vom Ziel und Wetterbedingungen. Die Zeit in Minuten und Sekunden, die Sie bis zum Ziel benötigen.

Klassifizierung

Klassifizierungsmodelle sagen die Wahrscheinlichkeit vorher, dass etwas zu einer Kategorie gehört. Im Gegensatz zu Regressionsmodellen, deren Ausgabe eine Zahl ist, geben Klassifizierungsmodelle einen Wert aus, der angibt, ob etwas zu einer bestimmten Kategorie gehört oder nicht. Klassifizierungsmodelle werden beispielsweise verwendet, um vorherzusagen, ob eine E-Mail Spam ist oder ob ein Foto eine Katze enthält.

Klassifizierungsmodelle werden in zwei Gruppen unterteilt: binäre Klassifizierung und mehrstufige Klassifizierung. Bei binären Klassifizierungsmodellen wird ein Wert aus einer Klasse ausgegeben, die nur zwei Werte enthält, z. B. ein Modell, das entweder rain oder no rain ausgibt. Bei Modellen für die mehrstufige Klassifizierung wird ein Wert aus einer Klasse ausgegeben, die mehr als zwei Werte enthält. Ein Beispiel wäre ein Modell, das entweder rain, hail, snow oder sleet ausgeben kann.

Wissen testen

Welche Art von Modell würden Sie verwenden, wenn Sie mit einem ML-Modell den Energieverbrauch für kommerzielle Gebäude vorhersagen möchten?
Regression
Der Energieverbrauch wird in Kilowattstunden (kWh) gemessen, also in einer Zahl. Daher sollten Sie ein Regressionsmodell verwenden.
Klassifizierung
Mit Klassifizierungsmodellen wird vorhergesagt, ob etwas zu einer Kategorie gehört oder nicht, während mit Regressionsmodellen eine Zahl vorhergesagt wird. Da der Energieverbrauch in Kilowattstunden (kWh) gemessen wird, also eine Zahl ist, sollten Sie ein Regressionsmodell verwenden.

Unbeaufsichtigtes Lernen

Modelle für nicht überwachtes Lernen treffen Vorhersagen anhand von Daten, die keine richtigen Antworten enthalten. Ziel eines Modells für unüberwachtes Lernen ist es, aussagekräftige Muster in den Daten zu identifizieren. Mit anderen Worten: Das Modell hat keine Hinweise dazu, wie die einzelnen Daten kategorisiert werden sollen, sondern muss stattdessen seine eigenen Regeln ableiten.

Ein häufig verwendetes Modell für unbeaufsichtigtes Lernen verwendet eine Methode namens Clustering. Das Modell findet Datenpunkte, die natürliche Gruppierungen abgrenzen.

Ein Bild mit farbigen Punkten in Clustern.

Abbildung 1. Ein ML-Modell, das ähnliche Datenpunkte clustert.

Ein Bild mit farbigen Punkten in Clustern, die in einer Form eingeschlossen sind und aneinander grenzen.

Abbildung 2. Clustergruppen mit natürlichen Abgrenzungen.

Das Clustering unterscheidet sich von der Klassifizierung, da die Kategorien nicht von Ihnen definiert werden. Ein nicht überwachtes Modell kann beispielsweise ein Wetter-Dataset basierend auf der Temperatur clustern und so Segmentierungen aufzeigen, die die Jahreszeiten definieren. Anhand Ihrer Kenntnisse des Datensatzes können Sie dann versuchen, diese Cluster zu benennen.

Ein Bild mit farbigen Punkten in Clustern, die als Schnee, Regen, Hagel und kein Regen gekennzeichnet sind.

Abbildung 3. Ein ML-Modell, das ähnliche Wettermuster clustert

Ein Bild mit farbigen Punkten in Clustern, die als Schnee, Regen, Hagel und kein Regen gekennzeichnet sind, die in einer Form eingeschlossen sind und aneinander grenzen.

Abbildung 4. Cluster von Wettermustern, die als Schnee, Schneeregen, Regen und kein Regen gekennzeichnet sind.

Wissen testen

Was unterscheidet einen beaufsichtigten Ansatz von einem unbeaufsichtigten Ansatz?
Bei einem überwachten Ansatz werden Daten mit der richtigen Antwort bereitgestellt.
Bei einem überwachten Ansatz werden Daten mit der richtigen Antwort bereitgestellt. Das Modell soll Verbindungen in den Daten finden, die die richtige Antwort liefern. Bei einem unüberwachten Ansatz werden Daten ohne die richtige Antwort bereitgestellt. Seine Aufgabe besteht darin, Gruppierungen in den Daten zu finden.
Bei einem supervised approach wird in der Regel Clustering verwendet.
Bei einem unüberwachten Ansatz wird Clustering verwendet.
Bei einem unüberwachten Ansatz ist bekannt, wie Datencluster gekennzeichnet werden.
Bei einem unbeaufsichtigten Ansatz ist nicht bekannt, was die Datencluster bedeuten. Sie müssen sie anhand Ihrer Kenntnis der Daten definieren.

Reinforcement Learning

Reinforcement-Learning-Modelle treffen Vorhersagen, indem sie aufgrund von Aktionen in einer Umgebung Belohnungen oder Strafen erhalten. Ein System für bestärkendes Lernen generiert eine Richtlinie, die die beste Strategie für die meisten Prämien definiert.

Mithilfe von bestärkendem Lernen werden Roboter trainiert, Aufgaben auszuführen, z. B. durch einen Raum zu gehen, und Softwareprogramme wie AlphaGo, um das Spiel Go zu spielen.

Generative KI

Generative KI ist eine Klasse von Modellen, die Inhalte aus der Nutzereingabe erstellen. Mit generativer KI lassen sich beispielsweise einzigartige Bilder, Musikkompositionen und Witze erstellen. Sie kann Artikel zusammenfassen, erklären, wie eine Aufgabe ausgeführt wird, oder ein Foto bearbeiten.

Generative KI kann eine Vielzahl von Eingaben verarbeiten und eine Vielzahl von Ausgaben erstellen, z. B. Text, Bilder, Audio und Video. Es kann auch Kombinationen dieser Elemente aufnehmen und erstellen. Ein Modell kann beispielsweise ein Bild als Eingabe verwenden und ein Bild und Text als Ausgabe erstellen oder ein Bild und Text als Eingabe verwenden und ein Video als Ausgabe erstellen.

Wir können generative Modelle anhand ihrer Eingaben und Ausgaben beschreiben, die in der Regel als „Eingabetyp“-zu-„Ausgabetyp“ geschrieben werden. Im Folgenden finden Sie beispielsweise eine unvollständige Liste einiger Eingaben und Ausgaben für generative Modelle:

  • Text-zu-Text
  • Text-zu-Bild
  • Text-zu-Video
  • Text-zu-Code
  • Text-in-Sprache
  • Bild und Text-zu-Bild

In der folgenden Tabelle sind Beispiele für generative Modelle, ihre Eingabe und ein Beispiel für die mögliche Ausgabe aufgeführt:

Modell Eingabe Beispielausgabe
Text-zu-Text Wer hat das Le Mans-Rennen erfunden? Das 24-Stunden-Rennen von Le Mans wurde vom Automobile Club de l'Ouest (ACO) ins Leben gerufen, einer 1906 gegründeten Motorsportorganisation. Das erste Rennen fand am 26.und 27.Mai 1923 auf dem Circuit de la Sarthe statt, einer 13,426 km langen Rennstrecke in der Nähe der französischen Stadt Le Mans. Das Rennen wurde ursprünglich als Werbemaßnahme für das ACO und die Sarthe-Region konzipiert.
Quelle: Bard
Text-zu-Bild Ein außerirdischer Oktopus schwebt durch ein Portal, während er eine Zeitung liest. Bild eines Cartoon-Oktopus
Quelle: Imagen
Text-zu-Video Ein fotorealistischer Teddybär schwimmt im Meer in San Francisco. Der Teddybär geht unter Wasser. Der Teddybär schwimmt mit bunten Fischen unter Wasser. Ein Pandabär schwimmt unter Wasser. Video eines schwimmenden Teddybären
Quelle: Phenaki
Text-zu-Code Schreiben Sie eine Python-Schleife, die eine Liste von Zahlen durchläuft und die Primzahlen ausgibt.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Quelle: Bard
Bild-zu-Text Bild eines Flamingos. Das ist ein Flamingo. Sie kommen in der Karibik vor.
Quelle: Google DeepMind

Wie funktioniert Generative AI? Allgemein gesagt lernen generative Modelle Muster in Daten, um neue, aber ähnliche Daten zu generieren. Beispiele für generative Modelle:

  • Komiker, die lernen, andere zu imitieren, indem sie das Verhalten und den Sprachstil von Menschen beobachten
  • Künstler, die lernen, in einem bestimmten Stil zu malen, indem sie viele Gemälde in diesem Stil studieren
  • Coverbands, die lernen, wie eine bestimmte Musikgruppe zu klingen, indem sie sich viel Musik dieser Gruppe anhören

Um einzigartige und kreative Ergebnisse zu erzielen, werden generative Modelle zuerst mit einem nicht überwachten Ansatz trainiert, bei dem das Modell lernt, die Daten nachzuahmen, mit denen es trainiert wird. Manchmal wird das Modell mithilfe von überwachtem oder verstärktem Lernen mit bestimmten Daten weiter trainiert, die sich auf Aufgaben beziehen, die das Modell ausführen könnte, z. B. einen Artikel zusammenfassen oder ein Foto bearbeiten.

Generative KI ist eine sich schnell entwickelnde Technologie, für die ständig neue Anwendungsfälle entdeckt werden. So helfen generative Modelle Unternehmen beispielsweise, ihre E-Commerce-Produktbilder zu optimieren, indem sie automatisch ablenkende Hintergründe entfernen oder die Qualität von Bildern mit niedriger Auflösung verbessern.