嵌入

嵌入是一種相對較低的維度空間,可用來翻譯高維度向量。嵌入功能可讓您更輕鬆地針對大型輸入進行機器學習,例如代表字詞的稀疏向量。在理想情況下,嵌入功能會在嵌入空間中同時指定語意相似的輸入內容,藉此擷取輸入中的部分語意。嵌入功能可瞭解並重複使用模型。

嵌入

  • 輸入:500,000 位使用者選擇觀看的 1,000,000 部電影
  • 工作:向使用者推薦電影

如要解決這個問題,您必須運用一些方法來確認電影類似。

一列從左到右的電影清單。從左側開始,'Shrek', 'The Incredibles',##9;The Triplets of Belleville', 'Harry Potter', 'Stareus&#39,&#39,&#3night,##night;#Menight,#39;''##9;

上一張投影片中的相同電影清單,但排列成二維度,例如 'Shrek'在 'The Incredibles 的左側和上方

與上圖類似,但每個象限都有軸和標籤。電影的排列方式如下:第一個右上方的右上角是包含「#39;Star Wars&#39」和「#39;The Dark Knight Rises&#39」的成人大片;電影《#39;Hero' & ' Crouching Tiger, White Dragbus to the the》第二右下象限是包含電影《#39;Bleu' ' Memento' ' Waging Life'》的成人藝術影院。第三這個左下象限是兒童藝術館,其中包含電影《百麗宮的三戰'》和 '華萊與格羅米特 (#39;)。左上方的第四個象限和最後一個象限是包含 'Shrek'、##9;The Inredibles' 和 ##9;Harry Potter' 的電影,位於電影《童謠》中。

排列方式與上一張投影片相同。'Shrek'和 ##9;Bleu'在 2D 嵌入層中會醒目顯示其座標。

  • 假設使用者對電影的感興趣程度可按 D 點大致說明
  • 每部電影都會變成 D 維點,其中維度 d 的值代表電影的長寬比
  • 嵌入資料可以從資料中學習
  • 不需獨立的訓練程序;嵌入圖層只是隱藏圖層,每個維度各有一個單元
  • 受監督的資訊 (例如正在觀看兩部電影的使用者) 可根據需要的工作,量身打造相關的嵌入內容
  • 直觀的單位將示範如何在 D 維空間中整理項目,以達到最佳最終目標
  • 每個範例 (此矩陣中的一列) 都是使用者觀看的功能 (電影) 的稀疏向量
  • 這個範例的深度表示如下:(0, 1, 0, 1, 0, 0, 0, 1)

時往往並不在空間和時間上。

每個表格的欄標題都是電影,每一列代表一個使用者和已觀看的電影。
  • 建立字典,將每個特徵對應至 0 到 1 之間的整數 - # 電影 - 1
  • 有效代表稀疏向量,僅如使用者觀看的電影。可能表示如下: 根據右側顯示的稀疏向量中的電影欄位置,電影 ' Belleville'、#39;Wallace and Gromit' 'Memento' 中的三欄結構可以有效地表示為 (0,1, 999999)
以表格形式呈現的向量 (每欄代表一個電影),而每一列代表一個使用者。下表包含上圖中的電影,編號為 1 至 999999。當使用者觀看電影時,系統會檢查表格中的每個儲存格。

預測房屋銷售價格的迴歸問題:

用於預測房屋銷售價格的深層類神經網路圖表

預測房屋銷售價格的迴歸問題:

用於預測房屋銷售價格的深層類神經網路圖表 (醒目顯示向量向量編碼)

預測房屋銷售價格的迴歸問題:

用於預測房屋銷售價格的深層類神經網路圖表 (醒目顯示的三維嵌入層)

預測房屋銷售價格的迴歸問題:

用於預測房屋銷售價格的深度類神經網路圖表 (醒目顯示額外的緯度和經度輸入功能)

預測房屋銷售價格的迴歸問題:

用於預測房屋銷售價格的深層類神經網路圖表 (醒目顯示進入多個隱藏層的輸入特徵)

預測房屋銷售價格的迴歸問題:

用於預測房屋銷售價格的深層類神經網路圖表 (醒目顯示深層類神經網路的輸出內容)

可預測手寫數字的多類別分類:

用於預測手寫數字的深層類神經網路圖表

可預測手寫數字的多類別分類:

用於預測手寫數字的深層類神經網路圖表 (醒目顯示稀疏向量編碼)

可預測手寫數字的多類別分類:

用於預測手寫數字的深層類神經網路圖表 (其他功能則醒目顯示)

可預測手寫數字的多類別分類:

用於預測手寫數字的深層類神經網路圖表 (醒目顯示三維嵌入)

可預測手寫數字的多類別分類:

用於預測手寫數字的深層類神經網路圖表 (醒目顯示的圖層)

可預測手寫數字的多類別分類:

用於預測手寫數字的深度類神經網路圖表 (醒目顯示記錄檔層)

可預測手寫數字的多類別分類:

用於預測手寫數字的深層類神經網路圖表 (目標類別層醒目顯示)

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深度類神經網路圖表

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深層類神經網路圖表 (目標類別圖層醒目顯示)

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深層類神經網路圖表 (醒目顯示向量向量編碼)

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深層類神經網路圖表 (醒目顯示三維嵌入)

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深層類神經網路圖表 (其他醒目顯示的功能)

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深層類神經網路圖表 (醒目顯示的圖層)

協同合作式篩選功能,預測系統推薦的電影:

用於預測推薦電影的深層類神經網路圖表 (醒目顯示記錄檔層)

深層網路

  • 每個隱藏單位都會對應一個維度 (潛在特徵)
  • 電影和隱藏圖層之間的邊緣權重是座標值
  • 深層類神經網路的樹狀圖,該層的節點中最低層的節點可連結至下一個較高層的三個點

單一電影嵌入的幾何圖形檢視畫面

3 個維度空間中的點,對應至深層類神經網路設定中低層節點。
  • 維度較高的嵌入能夠更準確地呈現輸入值之間的關係
  • 但是越多維度會增加過度配適的可能性,並導致訓練速度變慢
  • 經驗法則 (使用驗證資料或許是個很好的起點):
  • $$ dimensions \approx \sqrt[4]{possible\;values} $$
  • 以類似項目接近的方式將地圖項目 (例如電影、文字、...) 嵌入至低尺寸真實向量
  • 也可以將嵌入資料套用到大量資料 (例如音訊),建立有意義的相似指標
  • 共同嵌入各種資料類型 (例如文字、圖片、音訊...) 會定義兩者的相似程度