實際工作環境機器學習系統:測驗您的知識

  1. 您正在使用機器學習技術建構一個可預測獨角獸外觀的分類模型。您的資料集會詳細列出 10,000 次的獨角獸外觀,以及 10,000 個未顯現的獨角獸。資料集內含位置、時段、海拔高度、溫度、濕度、樹木覆蓋、彩虹和其他多種特徵。

    推出獨角獸外觀預測工具後,您需要重新訓練新資料,讓模型保持最新狀態。由於收集的新資料過多,因此決定限制訓練資料,方法是對一段時間內的新資料進行取樣。您也需要將獨角獸的每日和年度變化情況納入考量。你選擇的時間範圍為何?

  2. 您推出獨角獸外觀預測工具。成效良好!您在三週休假後回來發現模型品質大幅下滑。假設獨角獸行為在三週內不太可能發生變化。造成品質下滑最可能的原因為何?

  3. 您審查了模型在南極洲的預測結果,然後發現模型從這個模型發布到正式環境以來的預測成效不佳。下列何者可能是問題來源?

  4. 您的獨角獸外觀預測器已運作一年。您已修正許多問題,現在的品質良好。然而,您注意到一個小但持續發生的問題。您的模型品質在其他都市地區略低。可能原因為何?

  5. 透過所有疑難排解方法,您大幅提升了獨角獸模型的預測品質,導致用量增加十倍。然而,使用者現在抱怨模型速度非常慢。推論要求通常超過 30 秒才會傳回預測結果。下列哪一項變更有助於解決這個問題?