ไม้กางเขนฟีเจอร์: ทดสอบความเข้าใจ

ดูตัวเลือกด้านล่าง

เมืองต่างๆ ในแคลิฟอร์เนียมีราคาที่อยู่อาศัยที่แตกต่างกันอย่างมาก สมมติว่าคุณต้องสร้างโมเดลเพื่อคาดการณ์ราคาที่อยู่อาศัย ชุดฟีเจอร์หรือไม้เพื่อใช้งานฟีเจอร์ใดต่อไปนี้จะศึกษาความสัมพันธ์เฉพาะเมืองระหว่าง roomsPerPerson กับราคาที่อยู่อาศัยได้
ฟีเจอร์ที่เชื่อมโยง 3 รูปแบบ ได้แก่ [binned latitude], [binnedลองจิจูดลองจิจูด], [binned roomsPerPerson]
การเชื่อมโยงเป็นสิ่งที่ดีเนื่องจากจะช่วยให้โมเดลเรียนรู้ความสัมพันธ์ที่ไม่ใช่แบบเชิงเส้นภายในฟีเจอร์เดียว อย่างไรก็ตาม เมืองมีอยู่มากกว่า 1 มิติ ดังนั้นการเรียนรู้ความสัมพันธ์เฉพาะเมืองจึงต้องมีพิกัดละติจูดและลองจิจูด
ครอสฟีเจอร์เดียว: [ละติจูด X ลองจิจูด X RoomPerPerson]
ในตัวอย่างนี้ การข้ามคุณลักษณะที่มีมูลค่าจริงไม่ใช่แนวคิดที่ดี หากข้ามค่าจริง เช่น ละติจูดด้วยroomPerPerson จะทําให้ฟีเจอร์ 10% (เช่น ละติจูด) เปลี่ยนแปลงไป 10% และเทียบเท่ากับการเปลี่ยนแปลง 10% ในฟีเจอร์อื่น (เช่น RoomPerPerson)
ฟีเจอร์กากบาท 1 รายการ: [binned latitude lned longitude X binned roomsPerPerson]
ละติจูดแบบข้ามเส้นลองจิจูดพร้อมลองจิจูดลองจิจูดช่วยให้โมเดลดูข้อมูลเกี่ยวกับเอฟเฟกต์เฉพาะเมืองของ RoomPerPerson ได้ การผูกจะป้องกันการเปลี่ยนแปลงละติจูดในการสร้างผลลัพธ์เดียวกันกับการเปลี่ยนแปลงลองจิจูด ฟีเจอร์นี้อาจเรียนรู้เกี่ยวกับเมืองหรือในละแวกบ้าน หรือเป็นบล็อกเฉพาะเจาะจง ทั้งนี้ขึ้นอยู่กับรายละเอียดของถังขยะ
ไม้กางเขนฟีเจอร์ 2 รายการ ได้แก่ [binned latitude X binned roomsPerPerson] และ [binned longitude X binned roomsPerPerson]
การบินเป็นตัวเลือกที่ดี อย่างไรก็ตาม เมืองนั้นเป็นการรวมละติจูดและลองจิจูด ดังนั้นฟีเจอร์ที่มีลักษณะแยกกันจึงทําให้โมเดลไม่ได้เรียนรู้ราคาที่เจาะจงของเมือง