Was ist maschinelles Lernen?

Maschinelles Lernen (ML) bildet die Grundlage für einige der wichtigsten Technologien, die wir nutzen, von Übersetzungs-Apps bis hin zu autonomen Fahrzeugen. In diesem Kurs werden die wichtigsten hinter ML stehen.

ML bietet eine neue Möglichkeit, Probleme zu lösen, komplexe Fragen zu beantworten und neue Inhalte. ML kann das Wetter vorhersagen, Fahrtzeiten schätzen, Songs automatisch vervollständigen, Artikel zusammenfassen bisher nicht gesehene Bilder.

Im Grunde ist ML der Prozess, Training einer Software, einer sogenannten Modell, um nützliche Vorhersagen oder Inhalte aus Daten.

Angenommen, wir möchten eine App zur Vorhersage von Niederschlag erstellen. Wir könnten entweder einen traditionellen oder einen ML-Ansatz. Mit einem traditionellen eine physikbasierte Darstellung der Erdatmosphäre. und Oberfläche und berechnet riesige Mengen von Fluiddynamikgleichungen. Dies ist unglaublich schwierig.

Mit einem ML-Ansatz würden wir einem ML-Modell riesige Mengen an Wetterdaten bis das ML-Modell die mathematische Beziehung zwischen Wettermuster, die unterschiedliche Regenmengen erzeugen. Dann geben wir dem Feld die aktuellen Wetterdaten modellieren und die Regenmenge vorhersagen.

Wissenstest

Was ist ein „Modell“? beim maschinellen Lernen?
Ein Modell ist eine mathematische Beziehung, die aus Daten abgeleitet wird, die ein ML-System System nutzt, um Vorhersagen zu treffen
Ein Modell ist eine Computerhardware
Ein Modell ist eine kleinere Darstellung des Objekts, das Sie untersuchen.

Arten von ML-Systemen

ML-Systeme lassen sich in eine oder mehrere der folgenden Kategorien einteilen, je nachdem, wie sie lernen, Vorhersagen zu treffen oder Inhalte zu generieren:

  • Beaufsichtigtes Lernen
  • Unbeaufsichtigtes Lernen
  • Reinforcement Learning
  • Generative KI

Beaufsichtigtes Lernen

Überwachtes Lernen Modelle können Vorhersagen treffen, nachdem sie viele Daten mit den richtigen Antworten gesehen haben. und dann die Verbindungen zwischen den Elementen in den Daten zu erkennen, die richtigen Antworten zu liefern. Das ist so, als würde ein Schüler neues Material lernen, die sowohl Fragen als auch Antworten enthalten. Sobald der Schüler oder Student ausreichend alten Prüfungen geschult haben, ist der Schüler gut auf die neue Prüfung vorbereitet. Diese ML-Systeme sind „überwacht“ dass ein Mensch dem ML-System mit den bekannten korrekten Ergebnissen.

Zwei der häufigsten Anwendungsfälle für überwachtes Lernen sind Regression und Klassifizierung.

Regression

Ein Regressionsmodell sagt eine numerischen Wert. Ein Wettermodell, das die Regenmenge in Millimeter ist ein Regressionsmodell.

Weitere Beispiele für Regressionsmodelle finden Sie in der folgenden Tabelle:

Szenario Mögliche Eingabedaten Numerische Vorhersage
Zukünftiger Hauspreis Quadratmeterzahl, Postleitzahl, Anzahl der Schlafzimmer und Badezimmer, Grundstücksgröße, Hypothekenzinssatz, Grundsteuersatz, Baukosten und Anzahl der zum Verkauf stehenden Häuser in der Region. Der Preis der Immobilie.
Zukünftige Fahrtdauer Historische Verkehrslage (über Smartphones erfasst, Verkehrsinformationen) Sensoren, Mitfahrgelegenheiten und anderen Navigationsanwendungen), Entfernung von und die Wetterbedingungen. Die Zeit in Minuten und Sekunden bis zu einem Ziel.

Klassifizierung

Klassifizierungsmodelle sagen Wahrscheinlichkeit, dass etwas zu einer Kategorie gehört. Im Gegensatz zu Regressionsmodellen deren Ausgabe eine Zahl ist, geben Klassifizierungsmodelle einen Wert aus, der ob etwas zu einer bestimmten Kategorie gehört. Beispiel: Klassifizierungsmodelle werden verwendet, um vorherzusagen, eine Katze enthält.

Klassifizierungsmodelle sind in zwei Gruppen unterteilt: binäre Klassifizierung und mehrklassigen Klassifizierung. Binäre Klassifizierungsmodelle geben einen Wert aus einem Klasse, die nur zwei Werte enthält. Beispiel: Ein Modell, das entweder rain oder no rain. Klassifizierungsmodelle mit mehreren Klassen geben einen Wert aus einem Klasse, die mehr als zwei Werte enthält. Beispiel: Ein Modell, das entweder rain, hail, snow oder sleet.

Wissenstest

Wenn Sie ein ML-Modell verwenden möchten, um den Energieverbrauch für kommerzielle welche Art von Modell verwenden Sie?
Regression
Der Energieverbrauch wird in Kilowattstunden (kWh) gemessen. Daher empfiehlt es sich, ein Regressionsmodell zu verwenden.
Klassifizierung
Klassifizierungsmodelle sagen voraus, ob etwas zu einer Kategorie gehört oder nicht, während Regressionsmodelle eine Zahl vorhersagen. Da der Energieverbrauch in Kilowattstunden (kWh), also eine Zahl, verwenden Sie ein Regressionsmodell.

Unbeaufsichtigtes Lernen

Unüberwachtes Lernen Modelle treffen Vorhersagen, indem sie Daten erhalten, die keine korrekten Antworten. Ziel eines Modells für unüberwachtes Lernen ist es, Mustern zwischen den Daten. Das Modell hat also keine Hinweise darauf, wie jedes Datenelement in Kategorien einordnen, aber stattdessen eigene Regeln ableiten müssen.

Bei einem häufig verwendeten Modell für unüberwachtes Lernen wird eine sogenannte Clustering Das Modell findet Datenpunkte die natürliche Gruppierungen abgrenzen.

Ein Bild, das farbige Punkte in Clustern zeigt.

Abbildung 1. Ein ML-Modell, das ähnliche Datenpunkte gruppiert.

Ein Bild, das farbige Punkte in Clustern zeigt, die in einer Form eingeschlossen sind und einander umranden.

Abbildung 2. Gruppen von Clustern mit natürlichen Abgrenzungen.

Clustering unterscheidet sich von der Klassifizierung, weil die Kategorien nicht durch von dir. Ein unbeaufsichtigtes Modell könnte zum Beispiel ein Wetter-Dataset basierend auf Temperatur und zeigt Segmentierungen an, die die Jahreszeiten definieren. Dann können Sie Versuchen Sie, diese Cluster so zu benennen, dass Sie das Dataset verstehen.

Ein Bild, das farbige Punkte in Clustern zeigt, die als Schnee, Regen, Hagel und kein Regen gekennzeichnet sind.

Abbildung 3. Ein ML-Modell, das ähnliche Wettermuster in Clustern zusammenfasst.

Ein Bild, das farbige Punkte in Clustern zeigt, die als Schnee, Regen, Hagel und kein Regen gekennzeichnet sind, in einer Form umschlossen sind und sich aneinandergrenzen.

Abbildung 4. Cluster von Wettermustern, die als Schnee, Graupel, Regen und keinen Regen.

Wissenstest

Was unterscheidet einen überwachten von einem unbeaufsichtigten Ansatz?
Bei einem überwachten Ansatz werden Daten ausgegeben, die die richtige Antwort enthalten.
Bei einem überwachten Ansatz werden Daten ausgegeben, die die richtige Antwort enthalten. Die Aufgabe des Modells ist es, Verbindungen in den Daten zu finden, die den richtigen Antwort. Bei einem unbeaufsichtigten Ansatz werden Daten ohne die richtige Antwort ausgegeben. Seine Aufgabe Gruppierungen in den Daten zu finden.
Bei einem überwachten Ansatz wird in der Regel Clustering verwendet.
Bei einem unbeaufsichtigten Ansatz wird Clustering verwendet.
Bei einem unbeaufsichtigten Ansatz werden Datencluster mit Labels versehen.
Bei einem unbeaufsichtigten Ansatz kann die Bedeutung der Daten-Cluster nicht bekannt sein. Basierend auf Ihrem Verständnis der Daten liegt es an Ihnen, sie zu definieren.

Reinforcement Learning

Bestärkendes Lernen Modelle nutzen Belohnungen, um Vorhersagen zu treffen oder Strafen basierend auf Aktionen, die in einer Umgebung ausgeführt werden. Verstärkung generiert eine Richtlinie, die definiert die beste Strategie, um die meisten Belohnungen zu erhalten.

Bestärkendes Lernen wird verwendet, um Roboter für Aufgaben wie Gehen zu trainieren in einem Raum und Softwareprogramme wie AlphaGo um Go zu spielen.

Generative KI

Generative AI ist eine Klasse von Modellen. der Inhalte aus Nutzereingaben erstellt. Generative KI kann beispielsweise einzigartige Bilder, Musikkompositionen und Witze Artikel zusammenfassen, erklärt, wie man eine Aufgabe ausführt oder ein Foto bearbeitet.

Generative KI kann eine Vielzahl von Eingaben annehmen und eine Vielzahl von Ausgaben erstellen, z. B. Text, Bilder, Audio und Video. Es kann auch Kombinationen aus diese. Ein Modell kann z. B. ein Bild als Eingabe verwenden, ein Bild erstellen und Text als Ausgabe verwenden oder ein Bild und Text als Eingabe nehmen und ein Video als Ausgabe erstellen.

Wir können generative Modelle anhand ihrer Eingaben und Ausgaben besprechen, als „Art der Eingabe“-zu-„Art der Ausgabe“. Das folgende Beispiel zeigt eine unvollständige Liste einiger Eingaben und Ausgaben für generative Modelle:

  • Text-in-Text
  • Text-zu-Bild
  • Text-zu-Video
  • Text-zu-Code
  • Text-in-Sprache
  • Bild und Text-zu-Bild

In der folgenden Tabelle sind Beispiele für generative Modelle, ihre Eingabe und ein Beispiel für ihre mögliche Ausgabe:

Modell Eingabe Beispielausgabe
Text-in-Text Wer hat das Rennen von Le Mans erfunden? Das 24-Stunden-Rennen von Le Mans wurde vom Automobile Club de l'Ouest gegründet (ACO), ein Automobilverband von 1906. Der erste Rennen wurde abgehalten. am 26. und 27. Mai 1923 auf der 13, 426 km langen (8,345 Meilen) in der Nähe der Stadt Le Mans in Frankreich. Das Rennen war ursprünglich als Möglichkeit gedacht, das ACO und das Region Sarthe
Quelle: Bard
Text-zu-Bild Ein außerirdischer Tintenfisch schwebt durch ein Portal und liest eine Zeitung. Bild eines Cartoon-Oktopus.
Quelle: Imagen
Text-zu-Video Ein fotorealistischer Teddybär schwimmt im Meer in San Francisco. Der Teddybär geht unter Wasser. Der Teddybär schwimmt weiter darunter mit bunten Fischen. Ein Pandabär schwimmt unter Wasser. Video eines Teddybären, der unter Wasser schwimmt.
Quelle: Phenaki
Text-zu-Code Schreiben Sie eine Python-Schleife, die eine Liste von Zahlen durchläuft und die Primzahlen ausgibt.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Quelle: Bard
Bild zu Text Bild eines Flamingos. Das ist ein Flamingo. Man findet sie auch in der Karibik.
<ph type="x-smartling-placeholder"></ph> Quelle: Google DeepMind

Wie funktioniert Generative AI? Grundsätzlich lernen generative Modelle Muster in Daten mit dem Ziel, neue, aber ähnliche Daten zu erzeugen. Generatives Modell Modelle so aussehen:

  • Comedians, die lernen, andere nachzuahmen, indem sie das Verhalten und Sprechstil
  • Künstler, die in einem bestimmten Stil malen, indem sie viele verschiedene Gemälde in diesem Stil
  • Coverbands, die lernen, wie eine bestimmte Musikgruppe zu klingen, indem sie viel Musik von dieser Gruppe

Um einzigartige und kreative Ergebnisse zu erzielen, werden generative Modelle zu Beginn trainiert mithilfe eines unbeaufsichtigten Ansatzes, bei dem das Modell lernt, auf dem sie trainiert wurden. Das Modell wird manchmal mithilfe von überwachten bestärkendes Lernen mit spezifischen Daten im Zusammenhang mit Aufgaben, die das Modell sein könnte beispielsweise einen Artikel zusammenzufassen oder ein Foto zu bearbeiten.

Generative KI ist eine sich schnell entwickelnde Technologie mit immer wieder neuen Anwendungsfällen. entdeckt werden. Mit generativen Modellen können Unternehmen beispielsweise Bilder von E-Commerce-Produkten durch automatisches Entfernen störender Hintergründe oder die Qualität von Bildern mit niedriger Auflösung verbessern.