取景:瞭解你的理解能力

監督式學習

請查看下列選項。

假設您希望開發受監督的機器學習模型,以預測特定電子郵件是否為「垃圾郵件」或「非垃圾郵件」。以下哪些敘述正確?
未標示為「垃圾郵件」或「非垃圾郵件」的電子郵件則無標籤。
我們的標籤包含「免責」和「非垃圾郵件」值,因此尚未加上垃圾郵件或非垃圾郵件的電子郵件就屬於沒有標籤的範例。
主旨標題中的文字就是良好的標籤。
主旨標題中的字詞可能是絕佳功能,但無法加上好標籤。
我們會使用沒有標籤的範例來訓練模型。
我們會使用已加上標籤的範例來訓練模型。然後,我們會針對無標籤的範例執行訓練模型,藉此推斷未加上標籤的電子郵件是否為垃圾郵件。
套用至部分範例的標籤可能不準確。
那還用說!請務必檢查資料的可靠性。這個資料集的標籤可能來自電子郵件中的特定電子郵件使用者。由於大部分使用者系統不會將每封可疑的電子郵件標示為垃圾郵件,因此可能無法判斷電子郵件是否為垃圾郵件。此外,垃圾內容發布者也可能會想加上錯誤標籤,刻意打擊我們的模型。

功能與標籤

請查看下列選項。

假設線上鞋店想建立受監督的機器學習模型,為使用者提供個人化的鞋款建議。也就是說,模型會建議小雅將成組的鞋款提供給小馬,並將不同的鞋款推薦給小珍。系統會使用過往的使用者行為資料來產生訓練資料。以下哪些敘述正確?
「鞋碼」是一個有用的特征。
「鞋子大小」是可量化的信號,可能會大幅影響使用者是否會喜歡推薦的鞋款。舉例來說,如果 Marty 的尺寸為 9,則建議不要建議尺寸 7 的鞋。
"Shoe 美容</a>是一項實用功能。
良好的功能為具體且可量化。 「美妝」概念的概念太過精闢,不實用。 「美妝」應該是一組具體的特徵,例如風格和顏色。樣式和顏色都比美妝更美。
"使用者點選鞋款的說明 ' 是實用的標籤。
使用者可能只想閱讀他們喜愛的鞋款。因此,使用者點擊次數是可觀察且可量化的指標,可做為良好的訓練標籤。由於我們的訓練資料衍生自過往的使用者行為,因此標籤必須衍生出與使用者偏好高度相關的目標行為,例如點擊。
"users adorororing ad"」是實用的標籤。
「可量」不是可觀察的可量化指標。我們最好搜尋的是可觀察的 Proxy 指標。