Глоссарий машинного обучения: рекомендательные системы

На этой странице содержится глоссарий терминов Рекомендательных систем. Чтобы просмотреть все термины глоссария, нажмите здесь .

С

поколение кандидатов

#recsystems

Начальный набор рекомендаций, выбранный рекомендательной системой . Например, рассмотрим книжный магазин, предлагающий 100 000 наименований. На этапе генерации кандидатов создается гораздо меньший список подходящих книг для конкретного пользователя, скажем, 500. Но даже 500 книг — это слишком много, чтобы рекомендовать пользователю. Последующие, более дорогостоящие этапы системы рекомендаций (такие как выставление оценок и изменение рейтинга ) сводят эти 500 к гораздо меньшему и более полезному набору рекомендаций.

совместная фильтрация

#recsystems

Прогнозирование интересов одного пользователя на основе интересов множества других пользователей. Совместная фильтрация часто используется в рекомендательных системах .

я

матрица элементов

#recsystems

В рекомендательных системах - матрица векторов внедрения , созданная путем матричной факторизации и содержащая скрытые сигналы о каждом элементе . Каждая строка матрицы элементов содержит значение одного скрытого признака для всех элементов. Например, рассмотрим систему рекомендаций фильмов. Каждый столбец в матрице элементов представляет один фильм. Скрытые сигналы могут представлять жанры или могут быть более сложными для интерпретации сигналами, которые включают сложное взаимодействие между жанром, звездами, возрастом фильма или другими факторами.

Матрица элементов имеет то же количество столбцов, что и целевая матрица, которая подвергается факторизации. Например, если система рекомендаций фильмов оценивает 10 000 названий фильмов, матрица элементов будет содержать 10 000 столбцов.

предметы

#recsystems

В рекомендательной системе — объекты, которые рекомендует система. Например, видео — это товары, которые рекомендует видеомагазин, а книги — это товары, которые рекомендует книжный магазин.

М

матричная факторизация

#recsystems

В математике - механизм поиска матриц, скалярное произведение которых аппроксимирует целевую матрицу.

В рекомендательных системах целевая матрица часто содержит оценки пользователей по элементам . Например, целевая матрица для системы рекомендаций фильмов может выглядеть примерно так, где положительные целые числа — это рейтинги пользователей, а 0 означает, что пользователь не оценил фильм:

Касабланка Филадельфийская история Черная пантера Удивительная женщина Криминальное чтиво
Пользователь 1 5.0 3.0 0,0 2.0 0,0
Пользователь 2 4.0 0,0 0,0 1.0 5.0
Пользователь 3 3.0 1.0 4.0 5.0 0,0

Целью системы рекомендаций фильмов является прогнозирование пользовательских рейтингов фильмов без рейтинга. Например, понравится ли Пользователю 1 «Черная Пантера» ?

Один из подходов к системам рекомендаций заключается в использовании матричной факторизации для создания следующих двух матриц:

Например, использование матричной факторизации для трех пользователей и пяти элементов может дать следующую матрицу пользователей и матрицу элементов:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Скалярное произведение матрицы пользователей и матрицы элементов дает матрицу рекомендаций, которая содержит не только исходные оценки пользователей, но и прогнозы для фильмов, которые каждый пользователь не смотрел. Например, рассмотрим рейтинг Касабланки , полученный пользователем 1, который составил 5,0. Скалярное произведение, соответствующее этой ячейке в матрице рекомендаций, должно быть около 5,0, а именно:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Что еще более важно, понравится ли Пользователю 1 «Черная Пантера» ? Скалярное произведение, соответствующее первой строке и третьему столбцу, дает прогнозируемый рейтинг 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Матричная факторизация обычно дает пользовательскую матрицу и матрицу элементов, которые вместе значительно более компактны, чем целевая матрица.

р

система рекомендаций

#recsystems

Система, которая выбирает для каждого пользователя относительно небольшой набор желаемых элементов из большого корпуса. Например, система видеорекомендаций может порекомендовать два видео из набора из 100 000 видеороликов, выбрав «Касабланку» и «Филадельфийскую историю» для одного пользователя и «Чудо-женщину» и «Черную пантеру» для другого. Система видеорекомендаций может основывать свои рекомендации на таких факторах, как:

  • Фильмы, которые оценили или посмотрели похожие пользователи.
  • Жанр, режиссеры, актеры, целевая аудитория...

повторное ранжирование

#recsystems

Заключительный этап системы рекомендаций , на котором оцененные элементы могут быть переоценены в соответствии с каким-либо другим (обычно не связанным с ОД) алгоритмом. При повторном ранжировании оценивается список элементов, созданных на этапе оценки , и предпринимаются такие действия, как:

  • Удаление товаров, которые пользователь уже приобрел.
  • Повышение рейтинга более свежих предметов.

С

подсчет очков

#recsystems

Часть системы рекомендаций , которая обеспечивает ценность или рейтинг для каждого элемента, созданного на этапе генерации кандидатов .

ты

пользовательская матрица

#recsystems

В рекомендательных системахвектор внедрения , создаваемый путем матричной факторизации и содержащий скрытые сигналы о предпочтениях пользователя. Каждая строка пользовательской матрицы содержит информацию об относительной силе различных скрытых сигналов для одного пользователя. Например, рассмотрим систему рекомендаций фильмов. В этой системе скрытые сигналы в пользовательской матрице могут отражать интерес каждого пользователя к определенным жанрам или могут быть более трудными для интерпретации сигналами, которые включают сложные взаимодействия множества факторов.

Матрица пользователей имеет столбец для каждой скрытой функции и строку для каждого пользователя. То есть пользовательская матрица имеет то же количество строк, что и целевая матрица, которая подвергается факторизации. Например, если система рекомендаций фильмов рассчитана на 1 000 000 пользователей, матрица пользователей будет содержать 1 000 000 строк.

Вт

Взвешенный метод альтернативных наименьших квадратов (WALS)

#recsystems

Алгоритм минимизации целевой функции при матричной факторизации в рекомендательных системах , позволяющий уменьшить вес недостающих примеров. WALS минимизирует взвешенную квадратичную ошибку между исходной матрицей и реконструкцией, чередуя фиксацию факторизации строк и факторизации столбцов. Каждая из этих оптимизаций может быть решена с помощью выпуклой оптимизации по методу наименьших квадратов. Подробности смотрите в курсе «Рекомендательные системы» .