Glosarium Machine Learning: Sistem Rekomendasi

Halaman ini berisi istilah glosarium Sistem Rekomendasi. Untuk semua istilah glosarium, klik di sini.

C

pembuatan kandidat

#recsystems

Kumpulan rekomendasi awal yang dipilih oleh sistem rekomendasi. Misalnya, pertimbangkan toko buku yang menawarkan 100.000 judul. Fase pembuatan kandidat membuat daftar buku yang jauh lebih kecil untuk pengguna tertentu, misalnya 500. Namun, 500 buku terlalu banyak untuk direkomendasikan kepada pengguna. Fase berikutnya dari sistem rekomendasi yang lebih mahal (seperti penskoran dan peringkat ulang) mengurangi 500 rekomendasi tersebut menjadi set rekomendasi yang jauh lebih kecil dan berguna.

pemfilteran kolaboratif

#recsystems

Membuat prediksi tentang minat salah satu pengguna berdasarkan minat banyak pengguna lainnya. Pemfilteran kolaboratif sering digunakan dalam sistem rekomendasi.

I

matriks item

#recsystems

Dalam sistem rekomendasi, matriks vektor sematan yang dihasilkan oleh faktorisasi matriks yang menyimpan sinyal laten terkait setiap item. Setiap baris matriks item memiliki nilai fitur laten tunggal untuk semua item. Misalnya, pertimbangkan sistem rekomendasi film. Setiap kolom dalam matriks item mewakili satu film. Sinyal laten mungkin mewakili genre, atau mungkin sinyal yang lebih sulit ditafsirkan yang melibatkan interaksi kompleks antara genre, bintang, usia film, atau faktor lainnya.

Matriks item memiliki jumlah kolom yang sama dengan matriks target yang sedang difaktorkan. Misalnya, dalam sistem rekomendasi film yang mengevaluasi 10.000 judul film, matriks item akan memiliki 10.000 kolom.

item

#recsystems

Dalam sistem rekomendasi, entitas yang direkomendasikan oleh sistem. Misalnya, video adalah item yang direkomendasikan oleh toko video, sedangkan buku adalah item yang direkomendasikan oleh toko buku.

M

faktorisasi matriks

#recsystems

Dalam matematika, mekanisme untuk menemukan matriks yang produk titiknya mendekati matriks target.

Dalam sistem rekomendasi, matriks target sering kali mempertahankan rating pengguna untuk item. Misalnya, matriks target untuk sistem rekomendasi film mungkin terlihat seperti berikut, dengan bilangan bulat positif adalah nilai pengguna dan 0 berarti pengguna tidak menilai film:

  Casablanca Kisah di Philadelphia Black Panther Wonder Woman Fiksi Pulp
Pengguna.1 5.0 3,0 0,0 2,0 0,0
Pengguna 2 4.0 0,0 0,0 1,0 5.0
Pengguna 3 3,0 1,0 4.0 5.0 0,0

Sistem rekomendasi film bertujuan untuk memprediksi rating pengguna untuk film yang belum diberi rating. Misalnya, apakah Pengguna 1 akan menyukai Black Panther?

Salah satu pendekatan untuk sistem rekomendasi adalah menggunakan faktorisasi matriks untuk menghasilkan dua matriks berikut:

Misalnya, menggunakan faktorisasi matriks pada tiga pengguna dan lima item kita dapat menghasilkan matriks pengguna dan matriks item berikut:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Produk titik dari matriks pengguna dan matriks item menghasilkan matriks rekomendasi yang tidak hanya berisi rating pengguna asli, tetapi juga prediksi untuk film yang belum dilihat oleh setiap pengguna. Misalnya, pertimbangkan rating Pengguna 1 dari Casablanca, yaitu 5.0. Produk titik yang sesuai dengan sel dalam matriks rekomendasi seharusnya bernilai sekitar 5, 0 dan:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Yang lebih penting, apakah Pengguna 1 akan menyukai Black Panther? Mengambil produk titik yang sesuai dengan baris pertama dan kolom ketiga akan menghasilkan rating yang diprediksi sebesar 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Faktorisasi matriks biasanya menghasilkan matriks pengguna dan matriks item yang, bersama-sama, secara signifikan lebih ringkas daripada matriks target.

R

sistem rekomendasi

#recsystems

Sistem yang memilih set yang relatif kecil untuk item yang diinginkan dari korpus besar untuk setiap pengguna. Misalnya, sistem rekomendasi video mungkin merekomendasikan dua video dari korpus yang berisi 100.000 video, yang memilih Casablanca dan The Philadelphia Story untuk satu pengguna, serta Wonder Woman dan Black Panther untuk pengguna yang lain. Sistem rekomendasi video mungkin mendasarkan rekomendasinya pada faktor-faktor seperti:

  • Film yang telah diberi rating atau ditonton oleh pengguna yang serupa.
  • Genre, sutradara, aktor, target demografi...

peringkat ulang

#recsystems

Tahap terakhir dari sistem rekomendasi, yang mana item yang diberi skor dapat dinilai ulang sesuai dengan beberapa algoritme (biasanya, non-ML) lainnya. Pengurutan ulang mengevaluasi daftar item yang dihasilkan oleh fase penskoran, yang mengambil tindakan seperti:

  • Menghapus item yang telah dibeli pengguna.
  • Meningkatkan skor item yang lebih baru.

S

penskoran

#recsystems

Bagian dari sistem rekomendasi yang memberikan nilai atau peringkat untuk setiap item yang dihasilkan oleh fase pembuatan kandidat.

U

matriks pengguna

#recsystems

Di sistem rekomendasi, vektor sematan yang dihasilkan oleh faktorisasi matriks yang menyimpan sinyal laten terkait preferensi pengguna. Setiap baris matriks pengguna memiliki informasi tentang kekuatan relatif berbagai sinyal laten untuk satu pengguna. Misalnya, pertimbangkan sistem rekomendasi film. Dalam sistem ini, sinyal laten dalam matriks pengguna mungkin mewakili minat setiap pengguna pada genre tertentu, atau mungkin sinyal yang lebih sulit ditafsirkan yang melibatkan interaksi kompleks di beberapa faktor.

Matriks pengguna memiliki kolom untuk setiap fitur laten dan baris untuk setiap pengguna. Artinya, matriks pengguna memiliki jumlah baris yang sama dengan matriks target yang sedang difaktorkan. Misalnya, dalam sistem rekomendasi film untuk 1.000.000 pengguna, matriks pengguna akan memiliki 1.000.000 baris.

W

Kotak Terbalik Terseimbang (WALS)

#recsystems

Algoritme untuk meminimalkan fungsi tujuan selama faktorisasi matriks dalam sistem rekomendasi, yang memungkinkan penurunan bobot contoh yang hilang. WALS meminimalkan error kuadrat berbobot antara matriks asli dan rekonstruksi dengan beralih antara memperbaiki faktorisasi baris dan faktorisasi kolom. Setiap pengoptimalan ini dapat diselesaikan dengan pengoptimalan konveks kuadrat terkecil. Untuk mengetahui detailnya, lihat kursus Sistem Rekomendasi.