測試自己的理解程度

下列問題有助於加深您對核心機器學習概念的瞭解。

預測能力

監督式機器學習模型會使用含有標記範例的資料集進行訓練。模型會學習如何從特徵預測標籤。不過,並非所有資料集中的特徵都有預測能力。在某些情況下,只有少數特徵可做為標籤的預測指標。在下列資料集中,請將價格設為標籤,其餘欄則設為特徵。

標示的汽車屬性範例。

您認為哪三項功能最能預測汽車價格?
Make_model、year、miles。
英里、變速箱、make_model。
顏色、高度、製造商/型號。
Tire_size、wheel_base、year。

監督式學習和非監督式學習

您會根據問題使用監督式或非監督式方法。舉例來說,如果您事先知道要預測的值或類別,就應使用監督式學習。不過,如果您想瞭解資料集是否包含任何區隔或相關範例的群組,就必須使用無監督式學習。

假設您有一個線上購物網站的使用者資料集,其中包含下列資料欄:

一列客戶屬性的圖片。

如果想瞭解造訪網站的使用者類型,您會使用監督式學習還是非監督式學習?
我要預測使用者屬於哪個類別,因此採用監督式學習。
非監督式學習。

假設您有一份住宅能源使用量資料集,其中包含下列欄:

一列住家屬性的圖片。

您會使用哪種機器學習技術,預測新建房屋每年的千瓦小時用量?
非監督式學習。
監督式學習。

假設您有一個航班資料集,其中包含下列欄:

一行航班資料的圖片。

如果您想預測客運車票的費用,會使用迴歸還是分類?
分類
迴歸
您可以根據資料集訓練分類模型,將客運車票的價格分類為「高」、「平均」或「低」嗎?
不行。您無法建立分類模型。coach_ticket_cost 值是數值,而非類別。
可以,但我們必須先將 coach_ticket_cost 欄中的數值轉換為分類值。
否。分類模型只會預測兩個類別,例如 spamnot_spam。這個模型需要預測三個類別。

訓練與評估

訓練模型後,我們會使用含有標記範例的資料集評估模型,並將模型的預測值與標籤的實際值進行比較。

請為問題選取兩個最合適的答案。

如果模型的預測結果與實際情況相差甚遠,您可以採取哪些行動來改善預測結果?
重新訓練模型,但只使用您認為對標籤最具預測力的功能。
嘗試採用其他訓練方式。舉例來說,如果您使用監督式方法,請嘗試無監督式方法。
您無法修正預測結果有很大落差的模型。
使用更大且多元化的資料集重新訓練模型。

您現在可以繼續進行機器學習歷程的下一個步驟:

  • 使用者 + AI 指南。如果您想瞭解 Google 員工、業界專家和學術研究人員提供的一系列方法、最佳做法和範例,以便使用機器學習。

  • 問題界定。如果您想瞭解實地測試過的建立機器學習模型方法,並避免常見的陷阱。

  • 機器學習密集課程。您是否已準備好透過深入且實用的做法,進一步瞭解機器學習。