การกำหนดกฎ L1
ลองดูตัวเลือกด้านล่าง
สมมติว่าโมเดลเชิงเส้นที่มีฟีเจอร์อินพุต 100 รายการ
10 ให้ข้อมูลได้ดีมาก
รหัส 90 ไม่ได้ให้ข้อมูล
สมมติว่าจุดสนใจทั้งหมดมีค่าระหว่าง -1 ถึง 1
ข้อความใดต่อไปนี้เป็นจริง
การกำหนดกฎ L1 จะส่งเสริมให้น้ำหนักที่ไม่ได้ข้อมูลมีค่าเกือบ (แต่ไม่ตรง) 0.0
โดยทั่วไป การกำหนด L1 ให้ระบุ lambda ที่เพียงพอมีแนวโน้มจะส่งเสริมให้ฟีเจอร์ที่ไม่ให้ข้อมูลมีน้ำหนักเท่ากับ 0.0
การทำแบบ L1 ต่างจากการทำ L2 ตรงที่การเรียก 1 ระดับจะ "ผลักดัน" ยากพอๆ กับ 0.0 ไม่ว่าจะมีน้ำหนักจาก 0.0 มากเพียงใด
การกำหนดกฎ L1 จะส่งเสริมให้น้ำหนักที่ไม่มีข้อมูลส่วนใหญ่มีค่าเป็น 0.0 พอดี
การกำหนดจำนวนแลมด้าให้เพียงพอใน L1 มักจะส่งเสริมให้น้ำหนักแบบไม่ได้ให้ข้อมูลมีค่าเท่ากับ 0.0 พอดี การดำเนินการดังกล่าวจะทำให้ฟีเจอร์ที่ไม่ให้ข้อมูลเหล่านี้ออกจากโมเดล
การกำหนดกฎ L1 อาจทำให้ฟีเจอร์ที่ให้ข้อมูลได้รับน้ำหนักเท่ากับ 0.0
โปรดระวัง การกำหนดกฎ L1 อาจทำให้ฟีเจอร์ประเภทต่อไปนี้มีน้ำหนักเป็น 0
ฟีเจอร์ที่ให้ข้อมูลเล็กน้อย
ฟีเจอร์ที่ให้ข้อมูลจำนวนมากในหลายระดับ
ฟีเจอร์ที่ให้ข้อมูลเกี่ยวข้องอย่างมากกับฟีเจอร์อื่นๆ ที่ให้ข้อมูลคล้ายกัน
การทำให้เป็นมาตรฐาน L1 เทียบกับ L2
ลองดูตัวเลือกด้านล่าง
สมมติว่าโมเดลเชิงเส้นที่มีฟีเจอร์อินพุต 100 รายการ ทั้งหมดมีค่าระหว่าง -1 ถึง 1 ดังนี้
10 ให้ข้อมูลได้ดีมาก
รหัส 90 ไม่ได้ให้ข้อมูล
การกำหนดกฎประเภทใดจะสร้างโมเดลที่เล็กกว่าได้
การกำหนดกฎ L2
การกำหนดกฎ L2 แทบจะไม่ลดจำนวนฟีเจอร์
กล่าวคือ การกำหนดกฎ L2 แทบจะไม่ลดขนาดโมเดล
การกำหนดกฎ L1
การกำหนดกฎ L1 มีแนวโน้มที่จะลดจำนวนฟีเจอร์ กล่าวคือ การกำหนดกฎ L1 มักจะลดขนาดโมเดล