Maschinelles Lernen (ML) ist die Grundlage einiger der wichtigsten Technologien, die wir nutzen, von Übersetzungs-Apps bis hin zu autonomen Fahrzeugen. In diesem Kurs werden die grundlegenden Konzepte der ML erläutert.
ML bietet eine neue Möglichkeit, Probleme zu lösen, komplexe Fragen zu beantworten und neue Inhalte zu erstellen. Mithilfe von ML lassen sich das Wetter vorhersagen, Fahrtzeiten schätzen, Songs empfehlen, Sätze automatisch vervollständigen, Artikel zusammenfassen und noch nie gesehene Bilder generieren.
Im Grunde genommen ist maschinelles Lernen der Prozess, bei dem eine Software, ein sogenanntes Modell, trainiert wird, um nützliche Vorhersagen zu treffen oder Inhalte aus Daten zu generieren.
Angenommen, wir möchten eine App erstellen, mit der Regen vorhergesagt werden kann. Wir könnten entweder einen traditionellen Ansatz oder einen ML-Ansatz verwenden. Mit einem herkömmlichen Ansatz würden wir eine physikbasierte Darstellung der Atmosphäre und Oberfläche der Erde erstellen und dabei eine enorme Menge an Gleichungen zur Strömungsmechanik berechnen. Das ist unglaublich schwierig.
Bei einem ML-Ansatz würden wir einem ML-Modell enorme Mengen an Wetterdaten zuführen, bis es die mathematische Beziehung zwischen Wettermustern, die unterschiedliche Niederschlagsmengen verursachen, gelernt hat. Wir geben dem Modell dann die aktuellen Wetterdaten und es prognostiziert die Regenmenge.
Wissen testen
Arten von ML-Systemen
ML-Systeme fallen in eine oder mehrere der folgenden Kategorien, je nachdem, wie sie lernen, Vorhersagen zu treffen oder Inhalte zu generieren:
- Beaufsichtigtes Lernen
- Unbeaufsichtigtes Lernen
- Reinforcement Learning
- Generative KI
Beaufsichtigtes Lernen
Modelle für das überwachte Lernen können Vorhersagen treffen, nachdem sie viele Daten mit den richtigen Antworten gesehen und dann die Verbindungen zwischen den Elementen in den Daten gefunden haben, die die richtigen Antworten liefern. Das ist vergleichbar mit einem Schüler oder Studenten, der sich neues Wissen aneignet, indem er sich alte Prüfungen ansieht, die sowohl Fragen als auch Antworten enthalten. Sobald der Schüler oder Student an genügend alten Prüfungen trainiert hat, ist er gut auf eine neue Prüfung vorbereitet. Diese ML-Systeme sind insofern „überwacht“, als ein Mensch dem ML-System Daten mit den bekannten korrekten Ergebnissen zur Verfügung stellt.
Zwei der häufigsten Anwendungsfälle für überwachtes Lernen sind Regression und Klassifizierung.
Regression
Mit einem Regressionsmodell lassen sich numerische Werte vorhersagen. Ein Wettermodell, das die Regenmenge in Zentimetern oder Millimetern vorhersagt, ist beispielsweise ein Regressionsmodell.
Weitere Beispiele für Regressionsmodelle finden Sie in der folgenden Tabelle:
Szenario | Mögliche Eingabedaten | Numerische Vorhersage |
---|---|---|
Zukünftiger Hauspreis | Wohnfläche, Postleitzahl, Anzahl der Schlafzimmer und Badezimmer, Grundstücksgröße, Hypothekenzinssatz, Grundsteuersatz, Baukosten und Anzahl der zum Verkauf stehenden Häuser in der Region. | Der Preis des Hauses. |
Zukünftige Fahrtzeit | Bisherige Verkehrsbedingungen (erfasst von Smartphones, Verkehrssensoren, Fahrdienst- und anderen Navigationsanwendungen), Entfernung vom Ziel und Wetterbedingungen. | Die Zeit in Minuten und Sekunden, die Sie bis zum Ziel benötigen. |
Klassifizierung
Klassifizierungsmodelle sagen die Wahrscheinlichkeit vorher, dass etwas zu einer Kategorie gehört. Im Gegensatz zu Regressionsmodellen, deren Ausgabe eine Zahl ist, geben Klassifizierungsmodelle einen Wert aus, der angibt, ob etwas zu einer bestimmten Kategorie gehört oder nicht. Klassifizierungsmodelle werden beispielsweise verwendet, um vorherzusagen, ob eine E-Mail Spam ist oder ob ein Foto eine Katze enthält.
Klassifizierungsmodelle werden in zwei Gruppen unterteilt: binäre Klassifizierung und mehrstufige Klassifizierung. Bei binären Klassifizierungsmodellen wird ein Wert aus einer Klasse ausgegeben, die nur zwei Werte enthält, z. B. ein Modell, das entweder rain
oder no rain
ausgibt. Bei Modellen für die mehrstufige Klassifizierung wird ein Wert aus einer Klasse ausgegeben, die mehr als zwei Werte enthält. Ein Beispiel wäre ein Modell, das entweder rain
, hail
, snow
oder sleet
ausgeben kann.
Wissen testen
Unbeaufsichtigtes Lernen
Modelle für nicht überwachtes Lernen treffen Vorhersagen anhand von Daten, die keine richtigen Antworten enthalten. Ziel eines Modells für unüberwachtes Lernen ist es, aussagekräftige Muster in den Daten zu identifizieren. Mit anderen Worten: Das Modell hat keine Hinweise dazu, wie die einzelnen Daten kategorisiert werden sollen, sondern muss stattdessen seine eigenen Regeln ableiten.
Ein häufig verwendetes Modell für unbeaufsichtigtes Lernen verwendet eine Methode namens Clustering. Das Modell findet Datenpunkte, die natürliche Gruppierungen abgrenzen.
Abbildung 1. Ein ML-Modell, das ähnliche Datenpunkte clustert.
Abbildung 2. Clustergruppen mit natürlichen Abgrenzungen.
Das Clustering unterscheidet sich von der Klassifizierung, da die Kategorien nicht von Ihnen definiert werden. Ein nicht überwachtes Modell kann beispielsweise ein Wetter-Dataset basierend auf der Temperatur clustern und so Segmentierungen aufzeigen, die die Jahreszeiten definieren. Anhand Ihrer Kenntnisse des Datensatzes können Sie dann versuchen, diese Cluster zu benennen.
Abbildung 3. Ein ML-Modell, das ähnliche Wettermuster clustert
Abbildung 4. Cluster von Wettermustern, die als Schnee, Schneeregen, Regen und kein Regen gekennzeichnet sind.
Wissen testen
Reinforcement Learning
Reinforcement-Learning-Modelle treffen Vorhersagen, indem sie aufgrund von Aktionen in einer Umgebung Belohnungen oder Strafen erhalten. Ein System für bestärkendes Lernen generiert eine Richtlinie, die die beste Strategie für die meisten Prämien definiert.
Mithilfe von bestärkendem Lernen werden Roboter trainiert, Aufgaben auszuführen, z. B. durch einen Raum zu gehen, und Softwareprogramme wie AlphaGo, um das Spiel Go zu spielen.
Generative KI
Generative KI ist eine Klasse von Modellen, die Inhalte aus der Nutzereingabe erstellen. Mit generativer KI lassen sich beispielsweise einzigartige Bilder, Musikkompositionen und Witze erstellen. Sie kann Artikel zusammenfassen, erklären, wie eine Aufgabe ausgeführt wird, oder ein Foto bearbeiten.
Generative KI kann eine Vielzahl von Eingaben verarbeiten und eine Vielzahl von Ausgaben erstellen, z. B. Text, Bilder, Audio und Video. Es kann auch Kombinationen dieser Elemente aufnehmen und erstellen. Ein Modell kann beispielsweise ein Bild als Eingabe verwenden und ein Bild und Text als Ausgabe erstellen oder ein Bild und Text als Eingabe verwenden und ein Video als Ausgabe erstellen.
Wir können generative Modelle anhand ihrer Eingaben und Ausgaben beschreiben, die in der Regel als „Eingabetyp“-zu-„Ausgabetyp“ geschrieben werden. Im Folgenden finden Sie beispielsweise eine unvollständige Liste einiger Eingaben und Ausgaben für generative Modelle:
- Text-zu-Text
- Text-zu-Bild
- Text-zu-Video
- Text-zu-Code
- Text-in-Sprache
- Bild und Text-zu-Bild
In der folgenden Tabelle sind Beispiele für generative Modelle, ihre Eingabe und ein Beispiel für die mögliche Ausgabe aufgeführt:
Modell | Eingabe | Beispielausgabe |
---|---|---|
Text-zu-Text | Wer hat das Le Mans-Rennen erfunden? |
Das 24-Stunden-Rennen von Le Mans wurde vom Automobile Club de l'Ouest (ACO) ins Leben gerufen, einer 1906 gegründeten Motorsportorganisation. Das erste Rennen fand am 26.und 27.Mai 1923 auf dem Circuit de la Sarthe statt, einer 13,426 km langen Rennstrecke in der Nähe der französischen Stadt Le Mans.
Das Rennen wurde ursprünglich als Werbemaßnahme für das ACO und die Sarthe-Region konzipiert. Quelle: Bard |
Text-zu-Bild | Ein außerirdischer Oktopus schwebt durch ein Portal, während er eine Zeitung liest. |
Quelle: Imagen |
Text-zu-Video | Ein fotorealistischer Teddybär schwimmt im Meer in San Francisco. Der Teddybär geht unter Wasser. Der Teddybär schwimmt mit bunten Fischen unter Wasser. Ein Pandabär schwimmt unter Wasser. |
Quelle: Phenaki |
Text-zu-Code | Schreiben Sie eine Python-Schleife, die eine Liste von Zahlen durchläuft und die Primzahlen ausgibt. |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) Quelle: Bard |
Bild-zu-Text |
Das ist ein Flamingo. Sie kommen in der Karibik vor. Quelle: Google DeepMind |
Wie funktioniert Generative AI? Allgemein gesagt lernen generative Modelle Muster in Daten, um neue, aber ähnliche Daten zu generieren. Beispiele für generative Modelle:
- Komiker, die lernen, andere zu imitieren, indem sie das Verhalten und den Sprachstil von Menschen beobachten
- Künstler, die lernen, in einem bestimmten Stil zu malen, indem sie viele Gemälde in diesem Stil studieren
- Coverbands, die lernen, wie eine bestimmte Musikgruppe zu klingen, indem sie sich viel Musik dieser Gruppe anhören
Um einzigartige und kreative Ergebnisse zu erzielen, werden generative Modelle zuerst mit einem nicht überwachten Ansatz trainiert, bei dem das Modell lernt, die Daten nachzuahmen, mit denen es trainiert wird. Manchmal wird das Modell mithilfe von überwachtem oder verstärktem Lernen mit bestimmten Daten weiter trainiert, die sich auf Aufgaben beziehen, die das Modell ausführen könnte, z. B. einen Artikel zusammenfassen oder ein Foto bearbeiten.
Generative KI ist eine sich schnell entwickelnde Technologie, für die ständig neue Anwendungsfälle entdeckt werden. So helfen generative Modelle Unternehmen beispielsweise, ihre E-Commerce-Produktbilder zu optimieren, indem sie automatisch ablenkende Hintergründe entfernen oder die Qualität von Bildern mit niedriger Auflösung verbessern.