特征组合:检查您的理解情况

查看以下选项。

加利福尼亚州不同城市的房价明显不同。 假设您必须创建一个模型来预测房价。以下哪组特征或特征组合可以学习 roomsPerPerson 与房价之间特定于城市的关系?
三个独立的分箱特征:[binned 纬度]、[分箱经度]、[binned roomPerPerson]
分箱是一种很好的方法,因为它可让模型在单个特征中学习非线性关系。但是,一个城市存在于多个维度上,因此学习特定于城市的关系需要跨越纬度和经度。
一个特征组合:[纬度 X 经度 X roomPerPerson]
在此示例中,不交叉组合实值特征。将纬度的真实值与 roomPerPerson 组合后,一个特征(例如纬度)的 10% 变化就相当于另一个特征(例如 roomPerPerson)的 10% 的变化。
一个特征组合:[binned 纬度 X 分箱经度 X 分箱 roomPerPerson]
将分箱纬度与分箱经度组合可以让模型了解 roomPerPerson 特定于城市的效果。分箱可防止纬度变化与经度变化产生相同的结果。根据分类的粒度,该特征交叉可能会学习特定于城市、街区或甚至特定于街区的效果。
两个特征组合:[binned radius X binned roomsPerPerson][binned 经度 X binned roomsPerPerson]
分箱是一个好主意;不过,城市是纬度和经度的结合体,因此单独的特征组合会导致模型无法了解特定于城市的价格。