Glossar zum maschinellen Lernen: Empfehlungssysteme

Diese Seite enthält Glossarbegriffe für Empfehlungssysteme. Alle Glossarbegriffe finden Sie hier.

C

Kandidatengenerierung

#recsystems

Die erste Gruppe von Empfehlungen, die von einem Empfehlungssystem ausgewählt wurden. Stellt euch als Beispiel einen Buchladen mit 100.000 Titeln vor. In der Phase der Kandidatengenerierung wird eine viel kleinere Liste geeigneter Bücher für einen bestimmten Nutzer erstellt, z. B. 500. Allerdings sind selbst 500 Bücher zu viel zu empfehlen. Nachfolgende, teurere Phasen eines Empfehlungssystems (z. B. Bewertungen und neues Ranking) reduzieren diese 500 Phasen auf einen viel kleineren, nützlicheren Satz von Empfehlungen.

Gemeinsames Filtern

#recsystems

Vorhersagen zu den Interessen eines Nutzers auf Grundlage der Interessen vieler anderer Nutzer. Das gemeinsame Filtern wird häufig in Empfehlungssystemen verwendet.

I

Elementmatrix

#recsystems

In Empfehlungssystemen ist eine Matrix der eingebetteten Vektoren, die durch die Matrixfaktorisierung generiert werden und Latente Signale zu jedem Element enthalten. Jede Zeile der Elementmatrix enthält den Wert eines einzelnen latenten Merkmals für alle Elemente. Nehmen wir als Beispiel ein Empfehlungssystem für Filme. Jede Spalte in der Elementmatrix stellt einen einzelnen Film dar. Die latenten Signale können Genres oder schwer zu interpretierende Signale repräsentieren, die komplexe Interaktionen zwischen Genre, Stars, Filmalter oder anderen Faktoren umfassen.

Die Elementmatrix hat die gleiche Anzahl von Spalten wie die Zielmatrix, die faktorisiert wird. Bei einem Empfehlungssystem für Filme, das 10.000 Filmtitel ausgewertet, hat die Elementmatrix beispielsweise 10.000 Spalten.

items

#recsystems

In einem Empfehlungssystem sind die Entitäten, die ein System empfiehlt. Videos sind beispielsweise die Elemente, die in einem Videoshop empfohlen werden, Bücher hingegen die Artikel, die in einer Buchhandlung empfohlen werden.

M

Matrixfaktorisierung

#recsystems

In Mathematik ein Mechanismus, um die Matrizen zu finden, deren Punktprodukt eine Zielmatrix angenähert hat.

In Empfehlungssystemen enthält die Zielmatrix häufig die Bewertungen der Nutzer für Elemente. Die Zielmatrix für ein Filmempfehlungssystem könnte in etwa so aussehen. Dabei sind die positiven Ganzzahlen Nutzerbewertungen und 0 bedeutet, dass der Nutzer den Film nicht bewertet hat:

  Casablanca Philadelphia Story Black Panther Wonder Woman Pulp Fiction
Nutzer 1 5 3 0.0 2 0.0
Nutzer 2 4.0 0.0 0.0 1 5
Nutzer 3 3 1 4.0 5,0 0.0

Das Filmempfehlungssystem versucht, Nutzerbewertungen für Filme ohne Bewertung vorherzusagen. Passt Nutzer 1 beispielsweise zu Black Panther?

Ein Ansatz für Empfehlungssysteme ist die Matrixfaktorisierung, um die folgenden beiden Matrizen zu generieren:

  • Eine Nutzermatrix, die die Anzahl der Nutzer x die Anzahl der Einbettungsdimensionen hat
  • Eine Artikelmatrix, die die Anzahl der Einbettungsdimensionen × die Anzahl der Elemente hat

Die Matrixfaktorisierung für unsere drei Nutzer und fünf Elemente könnte beispielsweise die folgende Nutzer- und Elementmatrix ergeben:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Aus dem Punktprodukt der Nutzer- und Artikelmatrix ergibt sich eine Empfehlungsmatrix, die nicht nur die ursprünglichen Nutzerbewertungen, sondern auch Vorhersagen für die Filme enthält, die jeder Nutzer nicht gesehen hat. Nehmen wir beispielsweise die Bewertung Casablanca von Nutzer 1 (5,0). Das Punktprodukt, das dieser Zelle in der Empfehlungsmatrix entspricht, sollte hoffentlich ungefähr 5,0 betragen und ist:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Noch wichtiger ist, dass Nutzer 1 wie Black Panther? Wenn für das Punktprodukt die erste Zeile und die dritte Spalte ausgewählt werden, ergibt sich eine vorhergesagte Bewertung von 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Die Matrixfaktorisierung ergibt in der Regel eine Nutzer- und Artikelmatrix, die zusammen wesentlich kompakter sind als die Zielmatrix.

R

Empfehlungssystem

#recsystems

Ein System, das für jeden Nutzer eine relativ kleine Gruppe wünschenswerter Elemente aus einem großen Korpus auswählt. Ein Videoempfehlungssystem kann beispielsweise zwei Videos aus einem Korpus von 100.000 Videos empfehlen, wobei Casablanca und The Philadelphia Story für einen Nutzer und Wonder Woman und Black Panther für einen anderen empfohlen werden. Ein Videoempfehlungssystem könnte unter anderem auf folgenden Faktoren basieren:

  • Filme, die von ähnlichen Nutzern bewertet oder angesehen wurden.
  • Genre, Regisseure, Schauspieler, demografische Zielgruppe...

Neuranking

#recsystems

Die letzte Phase eines Empfehlungssystems, in der bewertete Elemente auf der Grundlage eines anderen Algorithmus (in der Regel kein ML) neu bewertet werden können. Beim Ranking wird die Liste der Elemente ausgewertet, die in der Phase Bewertungen generiert wurden, darunter:

  • Artikel, die der Nutzer bereits gekauft hat, werden entfernt.
  • Die Punktzahl neuerer Elemente wird erhöht.

S

Bewertung

#recsystems

Der Teil eines Empfehlungssystems, der für jede in der Kandidatengenerierung erstellte Strategie einen Wert oder ein Ranking liefert.

U

Nutzermatrix

#recsystems

In Empfehlungssystemen ist ein Einbettungsvektor, der durch die Matrixfaktorisierung generiert wird, der Latente Signale zu Nutzereinstellungen enthält. Jede Zeile der Nutzermatrix enthält Informationen zur relativen Stärke verschiedener latenter Signale für einen einzelnen Nutzer. Nehmen wir als Beispiel ein Empfehlungssystem für Filme. In diesem System können die latenten Signale in der Nutzermatrix das Interesse jedes Nutzers an bestimmten Genres darstellen. Außerdem könnten sie schwerer zu interpretierende Signale enthalten, die komplexe Interaktionen über mehrere Faktoren hinweg umfassen.

Die Nutzermatrix enthält eine Spalte für jedes Latente Merkmal und eine Zeile für jeden Nutzer. Das heißt, die Nutzermatrix hat die gleiche Anzahl von Zeilen wie die Zielfaktor, die faktorisiert wird. Bei einem Filmempfehlungssystem für 1.000.000 Nutzer hat die Nutzermatrix beispielsweise 1.000.000 Zeilen.

W

Gewichtete abwechselnde Quadrate (WALS)

#recsystems

Ein Algorithmus zum Minimieren der Zielfunktion während der Matrixfaktorisierung in Empfehlungssystemen, was eine Gewichtung der fehlenden Beispiele ermöglicht. WALS minimiert den gewichteten Quadratfehler zwischen der ursprünglichen Matrix und der Rekonstruktion, indem abwechselnd die Zeilenfaktorisierung und die Spaltenfaktorisierung korrigiert werden. Jede dieser Optimierungen kann durch die Convex-Optimierung mit der geringsten Anzahl von Quadraten gelöst werden. Weitere Informationen finden Sie im Kurs zu Empfehlungssystemen.