Glossar für maschinelles Lernen: Empfehlungssysteme

Diese Seite enthält Glossarbegriffe zu Empfehlungssystemen. Hier finden Sie alle Begriffe aus dem Glossar.

C

Kandidatengenerierung

#recsystems

Die ersten Empfehlungen, die von einem Empfehlungssystem ausgewählt wurden. Angenommen, Sie haben einen Buchladen mit 100.000 Titeln. In der Phase der Kandidatengenerierung wird eine viel kleinere Liste geeigneter Bücher für einen bestimmten Nutzer erstellt, z. B. 500. Aber selbst 500 Bücher sind viel zu viele, um sie einem Nutzer zu empfehlen. In den nachfolgenden, kostenintensiveren Phasen eines Empfehlungssystems (z. B. Bewertung und Neubewertung) werden diese 500 auf eine viel kleinere, nützlichere Gruppe von Empfehlungen reduziert.

Weitere Informationen finden Sie im Kurs „Empfehlungssysteme“ unter Übersicht über die Kandidatengenerierung.

Kollaboratives Filtern

#recsystems

Vorhersagen zu den Interessen eines Nutzers basierend auf den Interessen vieler anderer Nutzer treffen. Das kollaborative Filtern wird häufig in Empfehlungssystemen verwendet.

Weitere Informationen finden Sie im Kurs „Empfehlungssysteme“ unter Kollaborativer Filter.

I

Artikelmatrix

#recsystems

In Empfehlungssystemen: Eine Matrix von Embedding-Vektoren, die durch Matrixfaktorisierung generiert werden und latente Signale zu jedem Element enthalten. Jede Zeile der Artikelmatrix enthält den Wert einer einzelnen latenten Funktion für alle Artikel. Nehmen wir als Beispiel ein Film-Empfehlungssystem. Jede Spalte in der Artikelmatrix steht für einen einzelnen Film. Die latenten Signale können Genres darstellen oder schwieriger zu interpretierende Signale sein, die komplexe Interaktionen zwischen Genre, Stars, Filmalter oder anderen Faktoren beinhalten.

Die Artikelmatrix hat dieselbe Anzahl von Spalten wie die Zielmatrix, die faktorisiert wird. Wenn beispielsweise ein Filmempfehlungssystem 10.000 Filmtitel auswertet, hat die Artikelmatrix 10.000 Spalten.

Elemente

#recsystems

In einem Empfehlungssystem sind das die Entitäten, die ein System empfiehlt. Beispielsweise sind Videos die Artikel, die in einem Videoladen empfohlen werden, während Bücher die Artikel sind, die in einem Buchladen empfohlen werden.

M

Matrixfaktorisierung

#recsystems

In der Mathematik ein Mechanismus zum Finden von Matrizen, deren Punktprodukt einer Zielmatrix nahekommt.

In Empfehlungssystemen enthält die Zielmatrix häufig die Bewertungen von Nutzern zu Elementen. Die Zielmatrix für ein Film-Empfehlungssystem könnte beispielsweise so aussehen: Die positiven Ganzzahlen sind Nutzerbewertungen und 0 bedeutet, dass der Nutzer den Film nicht bewertet hat:

  Casablanca The Philadelphia Story Black Panther Wonder Woman Pulp Fiction
Nutzer 1 5 3 0,0 2.0 0,0
Nutzer 2 4.0 0,0 0,0 1.0 5
Nutzer 3 3 1.0 4.0 5,0 0,0

Das Empfehlungssystem für Filme soll Nutzerbewertungen für Filme ohne Altersfreigabe vorhersagen. Wird Nutzer 1 beispielsweise Black Panther mögen?

Ein Ansatz für Empfehlungssysteme besteht darin, mithilfe der Matrixfaktorisierung die folgenden beiden Matrizen zu generieren:

  • Eine Nutzermatrix, die aus der Anzahl der Nutzer multipliziert mit der Anzahl der Einbettungsdimensionen besteht.
  • Eine Artikelmatrix, die aus der Anzahl der Einbettungsdimensionen multipliziert mit der Anzahl der Artikel besteht.

Die Matrixfaktorisierung für unsere drei Nutzer und fünf Artikel könnte beispielsweise die folgende Nutzer- und Artikelmatrix ergeben:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Die Punktprodukt der Nutzermatrix und der Artikelmatrix ergibt eine Empfehlungsmatrix, die nicht nur die ursprünglichen Nutzerbewertungen, sondern auch Vorhersagen für die Filme enthält, die die einzelnen Nutzer noch nicht gesehen haben. Angenommen, Nutzer 1 hat Casablanca mit 5, 0 bewertet. Das Punktprodukt, das dieser Zelle in der Empfehlungsmatrix entspricht, sollte idealerweise etwa 5,0 betragen.Das ist hier der Fall:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Und vor allem: Wird Nutzer 1 Black Panther mögen? Die Punktproduktsumme der ersten Zeile und der dritten Spalte ergibt eine geschätzte Bewertung von 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Die Matrixfaktorisierung führt in der Regel zu einer Nutzer- und einer Artikelmatrix, die zusammen deutlich kompakter sind als die Zielmatrix.

R

Empfehlungssystem

#recsystems

Ein System, das für jeden Nutzer eine relativ kleine Gruppe von gewünschten Elementen aus einem großen Korpus auswählt. Ein Empfehlungssystem für Videos könnte beispielsweise zwei Videos aus einem Korpus von 100.000 Videos empfehlen und dabei für einen Nutzer Casablanca und The Philadelphia Story und für einen anderen Wonder Woman und Black Panther auswählen. Ein Empfehlungssystem für Videos kann seine Empfehlungen auf Faktoren wie die folgenden stützen:

  • Filme, die ähnliche Nutzer bewertet oder angesehen haben.
  • Genre, Regisseure, Schauspieler, demografische Zielgruppe…

Neubewertung

#recsystems

Die letzte Phase eines Empfehlungssystems, in der bewertete Elemente nach einem anderen Algorithmus (in der Regel nicht ML) neu bewertet werden können. Bei der Neubewertung wird die Liste der Elemente, die in der Phase Bewertung generiert wurden, anhand der folgenden Kriterien neu bewertet:

  • Elemente entfernen, die der Nutzer bereits gekauft hat.
  • Die Bewertung aktuellerer Artikel wird erhöht.

S

Bewertung

#recsystems

Der Teil eines Empfehlungssystems, der für jeden Artikel, der in der Phase der Kandidatengenerierung erstellt wurde, einen Wert oder Rang liefert.

U

Nutzermatrix

#recsystems

In Empfehlungssystemen: Ein Embedding-Vektor, der durch Matrixfaktorisierung generiert wird und latente Signale zu Nutzerpräferenzen enthält. Jede Zeile der Nutzermatrix enthält Informationen zur relativen Stärke verschiedener latenter Signale für einen einzelnen Nutzer. Nehmen wir als Beispiel ein Film-Empfehlungssystem. In diesem System können die latenten Signale in der Nutzermatrix das Interesse der einzelnen Nutzer an bestimmten Genres darstellen oder schwieriger zu interpretierende Signale sein, die komplexe Interaktionen über mehrere Faktoren hinweg umfassen.

Die Nutzermatrix enthält eine Spalte für jedes latente Merkmal und eine Zeile für jeden Nutzer. Die Nutzermatrix hat also dieselbe Anzahl von Zeilen wie die Zielmatrix, die faktorisiert wird. Ein Film-Empfehlungssystem für 1.000.000 Nutzer hat beispielsweise 1.000.000 Zeilen.

W

Gewichtete alternierende kleinste Quadrate (WALS)

#recsystems

Ein Algorithmus zur Minimierung der Zielfunktion bei der Matrixfaktorisierung in Empfehlungssystemen, der eine geringere Gewichtung der fehlenden Beispiele ermöglicht. WALS minimiert den gewichteten quadratischen Fehler zwischen der ursprünglichen Matrix und der Rekonstruktion, indem abwechselnd die Zeilen- und die Spaltenfaktorisierung festgelegt wird. Jede dieser Optimierungen kann durch die Methode der kleinsten Quadrate und konvexe Optimierung gelöst werden. Weitere Informationen finden Sie im Kurs zu Empfehlungssystemen.