Глоссарий по машинному обучению: системы рекомендаций

Эта страница содержит термины глоссария Рекомендательных систем. Чтобы просмотреть все термины глоссария, щелкните здесь .

С

поколение кандидатов

#рексистемы

Начальный набор рекомендаций, выбранный рекомендательной системой . Например, рассмотрим книжный магазин, предлагающий 100 000 наименований. Фаза генерации кандидатов создает гораздо меньший список подходящих книг для конкретного пользователя, скажем, 500. Но даже 500 книг — это слишком много, чтобы рекомендовать пользователю. Последующие, более дорогие этапы системы рекомендаций (такие как подсчет очков и повторное ранжирование ) сокращают эти 500 до гораздо меньшего, более полезного набора рекомендаций.

совместная фильтрация

#рексистемы

Делать прогнозы об интересах одного пользователя на основе интересов многих других пользователей. Совместная фильтрация часто используется в рекомендательных системах .

я

матрица элементов

#рексистемы

В рекомендательных системах - матрица вложенных векторов , созданная матричной факторизацией , которая содержит скрытые сигналы о каждом элементе . Каждая строка матрицы элементов содержит значение одной скрытой функции для всех элементов. Например, рассмотрим систему рекомендаций фильмов. Каждый столбец в матрице элементов представляет один фильм. Скрытые сигналы могут представлять жанры или могут быть трудными для интерпретации сигналами, которые включают сложные взаимодействия между жанром, звездами, эпохой кино или другими факторами.

Матрица элементов имеет то же количество столбцов, что и целевая матрица, которая факторизуется. Например, если система рекомендаций по фильмам оценивает 10 000 названий фильмов, матрица элементов будет состоять из 10 000 столбцов.

предметы

#рексистемы

В рекомендательной системе объекты, которые система рекомендует. Например, видео — это товары, которые рекомендует видеомагазин, а книги — это товары, которые рекомендует книжный магазин.

М

матричная факторизация

#рексистемы

В математике - механизм поиска матриц, скалярное произведение которых приближается к целевой матрице.

В рекомендательных системах целевая матрица часто содержит оценки пользователей по элементам . Например, целевая матрица для системы рекомендаций фильмов может выглядеть примерно так, как показано ниже, где положительные целые числа — это рейтинги пользователей, а 0 означает, что пользователь не оценивал фильм:

Касабланка Филадельфийская история Черная пантера Удивительная женщина Криминальное чтиво
Пользователь 1 5,0 3.0 0,0 2.0 0,0
Пользователь 2 4.0 0,0 0,0 1,0 5,0
Пользователь 3 3.0 1,0 4.0 5,0 0,0

Система рекомендаций фильмов предназначена для прогнозирования оценок пользователей для фильмов без рейтинга. Например, понравится ли Пользователю 1 Черная пантера ?

Один из подходов к рекомендательным системам заключается в использовании матричной факторизации для создания следующих двух матриц:

Например, использование матричной факторизации для наших трех пользователей и пяти элементов может привести к следующей пользовательской матрице и матрице элементов:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Скалярное произведение пользовательской матрицы и матрицы элементов дает матрицу рекомендаций, которая содержит не только исходные оценки пользователей, но и прогнозы для фильмов, которые каждый пользователь не видел. Например, рассмотрим оценку Касабланки Пользователем 1, которая составила 5,0. Мы надеемся, что скалярное произведение, соответствующее этой ячейке в матрице рекомендаций, должно быть около 5,0, и оно равно:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Что еще более важно, понравится ли Пользователю 1 Черная Пантера ? Взятие скалярного произведения, соответствующего первой строке и третьему столбцу, дает прогнозируемый рейтинг 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Матричная факторизация обычно дает пользовательскую матрицу и матрицу элементов, которые вместе значительно компактнее, чем целевая матрица.

р

система рекомендаций

#рексистемы

Система, которая выбирает для каждого пользователя относительно небольшой набор желаемых элементов из большого корпуса. Например, система рекомендаций по видео может порекомендовать два видео из 100 000 видео, выбрав «Касабланку » и «Филадельфийская история» для одного пользователя и «Чудо-женщину» и «Черную пантеру» для другого. Система видеорекомендаций может основывать свои рекомендации на таких факторах, как:

  • Фильмы, которые оценили или посмотрели похожие пользователи.
  • Жанр, режиссеры, актеры, целевая аудитория...

переоценка

#рексистемы

Заключительный этап рекомендательной системы , во время которого оцениваемые элементы могут быть переоценены в соответствии с каким-либо другим (как правило, не ML) алгоритмом. При повторном ранжировании оценивается список элементов, созданных на этапе подсчета очков , и предпринимаются такие действия, как:

  • Исключение предметов, которые пользователь уже купил.
  • Увеличение количества свежих предметов.

С

подсчет очков

#рексистемы

Часть рекомендательной системы , предоставляющая значение или ранжирование для каждого элемента, созданного на этапе генерации кандидатов .

U

пользовательская матрица

#рексистемы

В рекомендательных системах - вектор встраивания , сгенерированный матричной факторизацией , который содержит скрытые сигналы о предпочтениях пользователя. Каждая строка пользовательской матрицы содержит информацию об относительной силе различных скрытых сигналов для одного пользователя. Например, рассмотрим систему рекомендаций фильмов. В этой системе скрытые сигналы в пользовательской матрице могут отражать интерес каждого пользователя к определенным жанрам или могут быть трудными для интерпретации сигналами, включающими сложные взаимодействия множества факторов.

Пользовательская матрица имеет столбец для каждой скрытой функции и строку для каждого пользователя. То есть пользовательская матрица имеет то же количество строк, что и целевая матрица, которая факторизуется. Например, если система рекомендаций по фильмам рассчитана на 1 000 000 пользователей, матрица пользователей будет состоять из 1 000 000 строк.

Вт

Взвешенный чередующийся метод наименьших квадратов (WALS)

#рексистемы

Алгоритм минимизации целевой функции при матричной факторизации в рекомендательных системах , позволяющий проводить понижение веса отсутствующих примеров. WALS минимизирует взвешенную квадратичную ошибку между исходной матрицей и реконструкцией, чередуя фиксацию факторизации строк и факторизации столбцов. Каждая из этих оптимизаций может быть решена выпуклой оптимизацией по методу наименьших квадратов. Подробнее см. в курсе «Системы рекомендаций» .