Glosarium Machine Learning: Sistem Rekomendasi

Halaman ini berisi istilah glosarium Sistem Rekomendasi. Untuk semua istilah glosarium, klik di sini.

C

pembuatan kandidat

#recsystems

Serangkaian rekomendasi awal yang dipilih oleh sistem rekomendasi. Misalnya, pertimbangkan toko buku yang menawarkan 100.000 judul. Fase pembuatan kandidat membuat sebuah daftar yang jauh lebih sedikit berisikan buku-buku yang cocok untuk pengguna tertentu, misalnya 500. Tapi bahkan 500 buku terlalu banyak untuk direkomendasikan kepada pengguna. Selanjutnya, lebih mahal, dalam suatu sistem rekomendasi (seperti skor dan pemeringkatan ulang) mengurangi 500 poin tersebut menjadi jumlah yang jauh lebih kecil, serangkaian rekomendasi yang lebih berguna.

penyaringan kolaboratif

#recsystems

Membuat prediksi tentang minat satu pengguna berdasarkan minat dari banyak pengguna lainnya. Pemfilteran kolaboratif sering digunakan dalam sistem rekomendasi.

I

matriks item

#recsystems

Dalam sistem rekomendasi, matriks vektor penyematan yang dihasilkan oleh faktorisasi matriks yang menyimpan sinyal laten tentang setiap item. Setiap baris matriks item memiliki nilai laten tunggal untuk semua item. Misalnya, pertimbangkan sistem rekomendasi film. Setiap kolom di matriks item mewakili satu film. Sinyal laten mungkin mewakili genre, atau mungkin lebih sulit untuk diinterpretasikan sinyal yang melibatkan interaksi kompleks antara genre, bintang, usia film, atau faktor lainnya.

Matriks item memiliki jumlah kolom yang sama dengan target matriks yang sedang difaktorkan. Misalnya, jika film sistem rekomendasi yang mengevaluasi 10.000 judul film, matriks item akan memiliki 10.000 kolom.

item

#recsystems

Dalam sistem rekomendasi, entitas yang yang direkomendasikan oleh sistem. Misalnya, video adalah item yang disimpan oleh video direkomendasikan, sementara buku adalah item yang direkomendasikan oleh toko buku.

M

faktorisasi matriks

#recsystems

Dalam matematika, mekanisme untuk menemukan matriks yang perkalian titiknya mendekati matriks target.

Dalam sistem rekomendasi, matriks target sering kali menahan rating pada item. Misalnya, target matriks untuk sistem rekomendasi film mungkin terlihat seperti berikut ini, di mana bilangan bulat positif adalah rating pengguna dan 0 berarti bahwa pengguna tidak menilai film tersebut:

  Casablanca Kisah Philadelphia Black Panther Perempuan Wonder Fiksi Pulp
Pengguna 1 5,0 3.0 0,0 2.0 0,0
Pengguna 2 4.0 0,0 0,0 1.0 5,0
Pengguna 3 3.0 1.0 4.0 5,0 0,0

Sistem rekomendasi film bertujuan untuk memprediksi peringkat pengguna film tanpa rating. Misalnya, apakah Pengguna 1 akan menyukai Black Panther?

Salah satu pendekatan untuk sistem rekomendasi adalah menggunakan matriks faktorisasi untuk menghasilkan dua matriks berikut:

  • Matriks pengguna, dibentuk dari jumlah pengguna X jumlah dimensi embedding.
  • Matriks item, dibentuk sesuai jumlah embedding dimensi X jumlah item.

Misalnya, menggunakan faktorisasi matriks pada tiga pengguna dan lima item kita dapat menghasilkan matriks pengguna dan matriks item berikut:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Produk titik dari matriks pengguna dan matriks item menghasilkan rekomendasi matriks yang tidak hanya berisi peringkat pengguna asli tetapi juga prediksi untuk film yang belum ditonton oleh setiap pengguna. Misalnya, pertimbangkan rating Pengguna 1 untuk Casablanca, yaitu 5,0. Titik produk yang sesuai dengan sel tersebut dalam matriks rekomendasi harus semoga sekitar 5,0, dan ini:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Yang lebih penting, apakah Pengguna 1 akan menyukai Black Panther? Mengambil produk titik yang sesuai dengan baris pertama dan kolom ketiga menghasilkan peringkat 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Faktorisasi matriks biasanya menghasilkan matriks pengguna dan matriks item yang, jika digabungkan, secara signifikan lebih ringkas daripada matriks target.

R

sistem rekomendasi

#recsystems

Sistem yang memilih satu set yang relatif kecil untuk setiap pengguna yang diinginkan items dari korpus besar. Misalnya, sistem rekomendasi video mungkin merekomendasikan dua video dari korpus yang berisi 100.000 video, memilih Casablanca dan The Philadelphia Story untuk satu pengguna, dan Wonder Woman serta Black Panther untuk yang lain. Sistem rekomendasi video mungkin mendasarkan rekomendasinya pada faktor-faktor seperti:

  • Film yang telah dinilai atau ditonton oleh pengguna yang serupa.
  • Genre, sutradara, aktor, demografi target...

pemeringkatan ulang

#recsystems

Tahap terakhir dalam sistem rekomendasi, di mana item yang dinilai dapat dinilai ulang menurut beberapa (biasanya, non-ML). Pemeringkatan ulang mengevaluasi daftar item yang dihasilkan oleh fase penskoran, dengan mengambil tindakan seperti:

  • Menghilangkan item yang telah dibeli pengguna.
  • Meningkatkan skor item yang lebih baru.

S

penskoran

#recsystems

Bagian dari sistem rekomendasi yang memberikan nilai atau peringkat untuk setiap item yang dihasilkan oleh Fase pemilihan kandidat.

U

matriks pengguna

#recsystems

Dalam sistem rekomendasi, vektor penyematan yang dihasilkan oleh faktorisasi matriks yang memiliki sinyal laten tentang preferensi pengguna. Setiap baris dari matriks pengguna memiliki informasi tentang nilai kekuatan dari berbagai sinyal laten untuk satu pengguna. Misalnya, pertimbangkan sistem rekomendasi film. Dalam sistem ini, sinyal laten dalam matriks pengguna dapat mewakili kepentingan setiap pengguna genre tertentu, atau mungkin sinyal yang lebih sulit diinterpretasikan yang melibatkan interaksi yang kompleks pada berbagai faktor.

Matriks pengguna memiliki kolom untuk setiap fitur laten dan satu baris untuk setiap pengguna. Artinya, matriks pengguna memiliki jumlah baris yang sama dengan target matriks yang sedang difaktorkan. Misalnya, jika film sistem rekomendasi untuk 1.000.000 pengguna, matriks pengguna akan memiliki 1.000.000 baris.

W

Kotak Alternatif Berbobot (WALS)

#recsystems

Sebuah algoritma untuk meminimalkan fungsi objektif selama faktorisasi matriks di sistem rekomendasi, yang memungkinkan menurunkan bobot dari contoh-contoh yang hilang. WALS meminimalkan bobot kuadrat kesalahan antara matriks asli dan rekonstruksi dengan secara bergantian antara memperbaiki faktorisasi baris dan faktorisasi kolom. Masing-masing pengoptimalan ini dapat diselesaikan dengan pengoptimalan konveks. Untuk mengetahui detailnya, lihat Kursus Sistem Rekomendasi.