Glossar für maschinelles Lernen: Empfehlungssysteme

Diese Seite enthält Glossarbegriffe für Recommendation Systems. Alle Glossarbegriffe finden Sie hier.

C

Kandidatengenerierung

#recsystems

Der erste Satz von Empfehlungen, die von einem Empfehlungssystem ausgewählt wurden. Angenommen, eine Buchhandlung bietet 100.000 Titel. In der Phase der Kandidatengenerierung wird eine viel kleinere Liste geeigneter Bücher für einen bestimmten Nutzer erstellt, z. B. 500. Aber selbst 500 Bücher sind viel zu viele, um sie einem Nutzer zu empfehlen. Nachfolgende, teurere Phasen eines Empfehlungssystems (z. B. Bewertung und Neueinstufung) reduzieren diese 500 auf einen viel kleineren, nützlicheren Satz von Empfehlungen.

gemeinsames Filtern

#recsystems

Sie treffen Vorhersagen zu den Interessen eines Nutzers basierend auf den Interessen vieler anderer Nutzer. Das kollaborative Filtern wird häufig in Empfehlungssystemen verwendet.

I

Artikelmatrix

#recsystems

In Empfehlungssystemen eine Matrix aus Einbettungsvektoren, die durch die Matrixfaktorisierung generiert wurde und latente Signale zu jedem Element enthält. Jede Zeile der Elementmatrix enthält den Wert eines einzelnen latenten Merkmals für alle Elemente. Stellen Sie sich zum Beispiel ein Empfehlungssystem für Filme vor. Jede Spalte in der Elementmatrix stellt einen einzelnen Film dar. Die latenten Signale können Genres repräsentieren oder schwer zu interpretierende Signale sein, die komplexe Interaktionen zwischen Genre, Stars, Filmalter oder anderen Faktoren beinhalten.

Die Artikelmatrix hat die gleiche Anzahl von Spalten wie die Zielmatrix, die faktorisiert wird. Beispiel: Bei einem Filmempfehlungssystem, das 10.000 Filmtitel bewertet, hat die Artikelmatrix 10.000 Spalten.

items

#recsystems

In einem Empfehlungssystem die Entitäten, die ein System empfiehlt. Beispielsweise sind Videos die Artikel, die in einem Videoladen empfohlen werden, während Bücher die Artikel sind, die eine Buchhandlung empfiehlt.

M

Matrixfaktorisierung

#recsystems

In der Mathematik ein Mechanismus zum Auffinden der Matrix, deren Punktprodukt sich einer Zielmatrix annähert.

In Empfehlungssystemen enthält die Zielmatrix häufig die Bewertungen der Nutzer für Artikel. Die Zielmatrix für ein Filmempfehlungssystem könnte beispielsweise so aussehen, wobei die positiven Ganzzahlen Nutzerbewertungen sind und 0 bedeutet, dass der Nutzer den Film nicht bewertet hat:

  Casablanca Philadelphia Story Black Panther Wonder Woman Pulp Fiction
Nutzer 1 5 3 0.0 2 0.0
Nutzer 2 4.0 0.0 0.0 1 5
Nutzer 3 3 1 4.0 5,0 0.0

Das Filmempfehlungssystem versucht, Nutzerbewertungen für Filme ohne Altersfreigabe vorherzusagen. Gefällt Nutzer 1 beispielsweise Black Panther?

Ein Ansatz für Empfehlungssysteme besteht darin, mit der Matrixfaktorisierung die folgenden beiden Matrizen zu generieren:

  • Eine Nutzermatrix in Form der Anzahl der Nutzer × der Anzahl der Einbettungsdimensionen
  • Eine Artikelmatrix in Form der Anzahl der Einbettungsdimensionen × der Anzahl der Elemente

Wenn Sie beispielsweise die Matrixfaktorisierung bei unseren drei Nutzern und fünf Elementen verwenden, könnten Sie die folgende Nutzer- und Artikelmatrix erhalten:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Das Skalarprodukt der Nutzer- und Artikelmatrix ergibt eine Empfehlungsmatrix, die nicht nur die ursprünglichen Nutzerbewertungen enthält, sondern auch Vorhersagen für die Filme, die jeder Nutzer noch nicht gesehen hat. Nehmen wir zum Beispiel die Bewertung Casablanca von Nutzer 1 mit 5,0. Das Skalarprodukt, das dieser Zelle in der Empfehlungsmatrix entspricht, sollte hoffentlich bei etwa 5,0 liegen.Diese lautet:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Und was noch wichtiger ist: Gefällt Nutzer 1 Black Panther? Wenn das Skalarprodukt der ersten Zeile und der dritten Spalte entspricht, ergibt sich eine vorhergesagte Bewertung von 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Die Matrixfaktorisierung liefert in der Regel eine Nutzermatrix und eine Artikelmatrix, die zusammen deutlich kompakter als die Zielmatrix sind.

R

Empfehlungssystem

#recsystems

Ein System, das für jeden Nutzer eine relativ kleine Gruppe von gewünschten Elementen aus einem großen Korpus auswählt. Ein Videoempfehlungssystem kann beispielsweise zwei Videos aus einem Korpus von 100.000 Videos empfehlen und für einen Nutzer Casablanca und The Philadelphia Story und für einen anderen Wonder Woman und Black Panther auswählen. Die Empfehlungen eines Videoempfehlungssystems können beispielsweise auf folgenden Faktoren basieren:

  • Filme, die von ähnlichen Nutzern bewertet oder angesehen wurden.
  • Genre, Regisseure, Schauspieler, Zielgruppe...

Re-Ranking

#recsystems

Die letzte Phase eines Empfehlungssystems, in der bewertete Elemente gemäß einem anderen Algorithmus (in der Regel kein ML-Algorithmus) neu benotet werden können. Beim erneuten Ranking wird die Liste der Elemente ausgewertet, die in der Bewertungsphase generiert wurden. Dazu gehören:

  • Artikel entfernen, die der Nutzer bereits gekauft hat
  • Die Bewertung neuerer Artikel wird erhöht.

S

Bewertung

#recsystems

Der Teil eines Empfehlungssystems, der einen Wert oder eine Rangfolge für jeden Artikel angibt, der in der Phase der Kandidatgenerierung erstellt wurde.

U

Nutzermatrix

#recsystems

In Empfehlungssystemen ein Einbettungsvektor, der durch die Matrixfaktorisierung generiert wird und latente Signale zu Nutzerpräferenzen enthält. Jede Zeile der Nutzermatrix enthält Informationen zur relativen Stärke verschiedener latenter Signale für einen einzelnen Nutzer. Stellen Sie sich zum Beispiel ein Empfehlungssystem für Filme vor. In diesem System können die latenten Signale in der Nutzermatrix das Interesse der einzelnen Nutzer in bestimmten Genres widerspiegeln oder schwer zu interpretierende Signale sein, die komplexe Interaktionen über mehrere Faktoren hinweg beinhalten.

Die User-Matrix hat eine Spalte für jedes latente Merkmal und eine Zeile für jeden Nutzenden. Das heißt, die Nutzermatrix hat die gleiche Anzahl von Zeilen wie die Zielmatrix, die faktorisiert wird. Beispiel: Bei einem Filmempfehlungssystem für 1.000.000 Nutzer enthält die Nutzermatrix 1.000.000 Zeilen.

W

Gewichtete abwechselnde kleinste Quadrate (WALS)

#recsystems

Ein Algorithmus zum Minimieren der Zielfunktion während der Matrixfaktorisierung in Empfehlungssystemen, der eine Heruntergewichtung der fehlenden Beispiele ermöglicht. WALS minimiert den gewichteten quadratischen Fehler zwischen der ursprünglichen Matrix und der Rekonstruktion, indem zwischen der Anpassung der Zeilenfaktorisierung und der Spaltenfaktorisierung gewechselt wird. Jede dieser Optimierungen kann durch die konvexe Optimierung der kleinsten Quadrate gelöst werden. Weitere Informationen finden Sie im Kurs Recommendation Systems.