测试您的掌握情况

以下问题有助于您巩固对核心机器学习概念的理解。

预测能力

监督式机器学习模型使用包含有标签示例的数据集进行训练。模型会学习如何根据特征预测标签。不过,数据集中并非每个特征都有预测能力。在某些情况下,只有少数特征可用作标签的预测因子。在下面的数据集中,将价格用作标签,其余列用作特征。

汽车属性的标记示例。

您认为哪三项特征最有可能预测汽车的价格?
英里、变速箱、品牌型号。
Make_model、year、miles。
颜色、高度、make_model。
Tire_size、wheel_base、year。

监督式学习和非监督式学习

根据问题,您将使用监督式或非监督式方法。例如,如果您事先知道要预测的值或类别,则可以使用监督学习。但是,如果您想了解数据集是否包含任何相关示例的分段或分组,则需要使用无监督学习。

假设您有一个在线购物网站的用户数据集,其中包含以下列:

一行客户属性的图片。

如果您想了解访问网站的用户类型,您会使用监督式学习还是非监督式学习?
监督学习,因为我尝试预测用户属于哪个类别。
非监督式学习。

假设您有一个包含以下列的住宅能耗数据集:

一行住宅属性的图片。

您会使用哪种类型的机器学习来预测新建住宅每年的用电量?
非监督式学习。
监督式学习。

假设您有一个包含以下列的航班数据集:

一行航班数据的图片。

如果您想预测长途汽车票的费用,您会使用回归还是分类?
回归
分类
根据数据集,您能否训练一个分类模型,将长途汽车票的费用分类为“高”“平均”或“低”?
不可以。分类模型只能预测两个类别,例如 spamnot_spam。此模型需要预测三个类别。
可以,但我们首先需要将 coach_ticket_cost 列中的数值转换为分类值。
不可以。无法创建分类模型。coach_ticket_cost 值为数值,而非分类值。

训练和评估

训练模型后,我们会使用包含标记示例的数据集对其进行评估,并将模型的预测值与标签的实际值进行比较。

为相应题目选择两个最佳答案。

如果模型的预测结果与实际情况相差甚远,您可以采取哪些措施来改进预测结果?
重新训练模型,但仅使用您认为对标签具有最强预测力的特征。
尝试采用其他训练方法。例如,如果您使用的是监督式方法,请尝试使用非监督式方法。
您无法修正预测结果相差甚远的模型。
使用更大、更具多样性的数据集重新训练模型。

现在,您可以继续学习机器学习:

  • 人与 AI 指南。如果您正在寻找 Google 员工、行业专家和学术研究人员提供的一套机器学习方法、最佳实践和示例。

  • 问题构建。如果你正在寻找经过实地测试的方法来创建机器学习模型并避免常见的陷阱。

  • 机器学习速成课程。如果您准备以深入且实操的方式详细了解机器学习。