Keuntungan pemfilteran kolaboratif & kekurangan

Kelebihan

Tidak perlu pengetahuan domain

Kita tidak memerlukan pengetahuan domain karena embedding otomatis dipelajari.

Serendipitas

Model tersebut dapat membantu pengguna menemukan minat baru. Secara terpisah, sistem ML dapat tidak tahu bahwa pengguna tertarik pada item tertentu, tetapi model mungkin masih merekomendasikannya karena pengguna serupa tertarik dengan item tersebut.

Titik awal yang bagus

Sampai batas tertentu, sistem hanya membutuhkan matriks umpan balik untuk melatih suatu matriks model faktorisasi. Secara khusus, sistem tidak memerlukan fitur kontekstual. Dalam praktiknya, generator ini dapat digunakan sebagai salah satu dari beberapa generator kandidat.

Kekurangan

Tidak dapat menangani item baru

Prediksi model untuk pasangan tertentu (pengguna, item) adalah titik perkalian embedding yang sesuai. Jadi, jika item tidak terlihat selama pelatihan, sistem tidak bisa membuat penyematan dan tidak dapat buat kueri model dengan item ini. Masalah ini sering disebut masalah cold-start. Namun, teknik berikut dapat mengatasi masalah {i>cold-start<i} sampai batas tertentu:

  • Proyeksi dalam WALS. Dengan item baru \(i_0\) yang tidak terlihat dalam pelatihan, jika sistem memiliki beberapa interaksi dengan pengguna, maka sistem dapat menghitung embeddings dengan mudah \(v_{i_0}\) untuk item ini tanpa harus untuk melatih ulang seluruh model. Sistem hanya perlu menyelesaikan langkah-langkah berikut atau versi berbobot:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    Persamaan sebelumnya sesuai dengan satu iterasi di WALS: embedding pengguna tetap bersifat tetap, dan sistem dari item \(i_0\). Hal yang sama dapat dilakukan untuk pengguna baru.

  • Heuristik untuk menghasilkan penyematan item baru. Jika sistem tidak memiliki interaksi, sistem dapat memperkirakan embeddingnya dengan merata-ratakan embedding item dari kategori yang sama, dari uploader yang sama (di YouTube), dan seterusnya.

Sulit untuk menyertakan fitur samping untuk kueri/item

Fitur samping adalah fitur selain ID kueri atau item. Untuk film rekomendasi, fitur samping dapat mencakup negara atau usia. Termasuk fitur samping yang tersedia akan meningkatkan kualitas model. Meskipun mungkin tidak mudah untuk menyertakan fitur sampingan dalam WALS, generalisasi WALS memungkinkan hal ini.

Untuk menggeneralisasi WALS, tingkatkan matriks input dengan fitur dengan menentukan matriks blok \(\bar A\), dengan:

  • Blok (0, 0) adalah matriks masukan asli \(A\).
  • Blok (0, 1) adalah encoding multi-hot fitur pengguna.
  • Blok (1, 0) adalah encoding multi-hot fitur item.