บทเรียนนี้มุ่งเน้นที่คำถามที่คุณควรถามเกี่ยวกับข้อมูลและโมเดลในระบบเวอร์ชันที่ใช้งานจริง
ฟีเจอร์แต่ละอย่างมีประโยชน์ไหม
คุณควรตรวจสอบโมเดลอย่างต่อเนื่องเพื่อนำฟีเจอร์ที่มีส่วนช่วยน้อยหรือไม่ช่วยเลยต่อความสามารถในการคาดการณ์ของโมเดลออก หากข้อมูลอินพุตสำหรับฟีเจอร์นั้นเปลี่ยนแปลงอย่างฉับพลัน ลักษณะการทํางานของโมเดลก็อาจเปลี่ยนแปลงอย่างฉับพลันด้วยในลักษณะที่ไม่พึงประสงค์
และลองพิจารณาคำถามที่เกี่ยวข้องต่อไปนี้ด้วย
- ประโยชน์ของฟีเจอร์นั้นคุ้มค่ากับค่าใช้จ่ายในการรวมหรือไม่
การเพิ่มฟีเจอร์อื่นๆ ลงในโมเดลเป็นสิ่งที่น่าดึงดูดใจเสมอ ตัวอย่างเช่น สมมติว่าคุณพบฟีเจอร์ใหม่ที่การใส่ฟีเจอร์นี้เข้าไปทําให้การคาดการณ์ของโมเดลดีขึ้นเล็กน้อย การคาดการณ์ที่ดีขึ้นเล็กน้อยดูดีกว่าการคาดการณ์ที่แย่ลงเล็กน้อยอย่างแน่นอน แต่ฟีเจอร์เพิ่มเติมก็เพิ่มภาระการดูแลรักษาด้วย
แหล่งข้อมูลของคุณเชื่อถือได้ไหม
คำถามที่ควรถามเกี่ยวกับความน่าเชื่อถือของข้อมูลที่คุณป้อน
- สัญญาณจะพร้อมใช้งานเสมอหรือมาจากแหล่งที่มาที่ไม่เชื่อถือได้ เช่น
- สัญญาณมาจากเซิร์ฟเวอร์ที่ขัดข้องเนื่องจากมีภาระงานมากหรือไม่
- สัญญาณมาจากผู้ใช้ที่ลาพักร้อนทุกเดือนสิงหาคมใช่ไหม
- ระบบที่คำนวณข้อมูลอินพุตของโมเดลมีการเปลี่ยนแปลงไหม หากใช่ ให้ทำดังนี้
- บ่อยแค่ไหน
- คุณจะทำอย่างไรเมื่อระบบดังกล่าวมีการเปลี่ยนแปลง
ลองสร้างสําเนาข้อมูลที่คุณได้รับจากกระบวนการต้นทางของคุณเอง จากนั้นให้เลื่อนข้อมูลต้นทางไปยังเวอร์ชันถัดไปก็ต่อเมื่อคุณแน่ใจว่าปลอดภัยแล้ว
โมเดลของคุณเป็นส่วนหนึ่งของลูปการตอบกลับหรือไม่
บางครั้งโมเดลอาจส่งผลต่อข้อมูลการฝึกของตนเอง ตัวอย่างเช่น ผลลัพธ์จากโมเดลบางรายการจะกลายเป็นฟีเจอร์อินพุต (โดยตรงหรือโดยอ้อม) ของโมเดลเดียวกันนั้น
บางครั้งโมเดลหนึ่งอาจส่งผลต่อโมเดลอื่น ตัวอย่างเช่น ลองพิจารณา 2 รูปแบบในการคาดการณ์ราคาหุ้น ดังนี้
- โมเดล ก ซึ่งเป็นโมเดลการคาดการณ์ที่ไม่ดี
- รูปแบบ ข.
เนื่องจากโมเดล ก มีข้อบกพร่อง จึงตัดสินใจซื้อหุ้นในหุ้น ข โดยไม่ได้ตั้งใจ
การซื้อเหล่านั้นทำให้ราคาของหุ้น X เพิ่มขึ้น โมเดล ข. ใช้ราคาของหุ้น ก. เป็นฟีเจอร์อินพุต ดังนั้นโมเดล ข. จึงอาจสรุปค่าของหุ้น ก. ผิดพลาดได้ ดังนั้น โมเดล ข จึงสามารถซื้อหรือขายหุ้นของหุ้น X ตามลักษณะการทำงานที่ผิดพลาดของโมเดล ก
ในทางกลับกัน ลักษณะการทํางานของโมเดล ข. อาจส่งผลต่อโมเดล ก. ซึ่งอาจทริกเกอร์ความคลั่งไคล้ดอกทิวลิปหรือราคาหุ้นของบริษัท ก. ลดลง
แบบฝึกหัด: ทดสอบความเข้าใจ
โมเดลใดต่อไปนี้ 3 รายการที่อาจมีลูปความคิดเห็น
โมเดลการคาดการณ์การเข้าชมที่คาดการณ์ความแออัดที่ทางออกของทางหลวงใกล้ชายหาดโดยใช้ขนาดฝูงชนที่ชายหาดเป็นหนึ่งในฟีเจอร์
ผู้มาเที่ยวทะเลบางรายมีแนวโน้มที่จะวางแผนการเดินทางตามการคาดการณ์การเข้าชม หากมีผู้คนจำนวนมากที่ชายหาดและคาดว่าการจราจรจะหนาแน่น ผู้คนจํานวนมากอาจเปลี่ยนแผนการเดินทาง ซึ่งอาจทําให้จำนวนผู้มาเที่ยวชายหาดลดลง ส่งผลให้การคาดการณ์การเข้าชมลดลง ซึ่งอาจทําให้จำนวนผู้มาเที่ยวเพิ่มขึ้น และวงจรนี้ก็จะวนซ้ำ
รูปแบบการแนะนำหนังสือซึ่งจะแนะนำนวนิยายที่ผู้ใช้อาจชอบโดยอิงจากความนิยม (เช่น จำนวนครั้งที่มีการซื้อหนังสือ)
การแนะนำหนังสือมีแนวโน้มที่จะกระตุ้นการซื้อ และยอดขายที่เพิ่มขึ้นเหล่านี้จะส่งกลับไปยังโมเดลเป็นอินพุต ซึ่งทำให้ระบบมีแนวโน้มที่จะแนะนำหนังสือเล่มเดิมเหล่านี้ในอนาคต
รูปแบบการจัดอันดับมหาวิทยาลัยที่ประเมินโรงเรียนบางส่วนตามการคัดเลือก โดยพิจารณาจากเปอร์เซ็นต์ของนักเรียนที่สมัครและได้รับคัดเลือก
การจัดอันดับของโมเดลอาจกระตุ้นความสนใจเพิ่มเติมให้กับโรงเรียนที่ได้รับการจัดอันดับสูงสุด ซึ่งจะเพิ่มจำนวนใบสมัครที่ได้รับ หากโรงเรียนเหล่านี้ยังคงรับนักเรียนในจำนวนเดิมต่อไป ความเลือกสรรจะเพิ่มขึ้น (เปอร์เซ็นต์ของนักเรียนที่ได้รับการรับเข้าจะลดลง) ซึ่งจะช่วยเพิ่มอันดับของโรงเรียนเหล่านี้ ซึ่งจะยิ่งทำให้ผู้มีโอกาสเป็นนักเรียนสนใจมากขึ้น และอื่นๆ
โมเดลผลการเลือกตั้งที่คาดการณ์ผู้ชนะในการเลือกตั้งนายกเทศมนตรีโดยการสํารวจผู้ลงคะแนนเสียง 2% หลังจากปิดการสำรวจแล้ว
หากโมเดลไม่เผยแพร่การคาดการณ์จนกว่าจะมีการจัดการเลือกตั้ง การคาดการณ์ของโมเดลจะส่งผลต่อพฤติกรรมของผู้เลือกเสียงไม่ได้
โมเดลมูลค่าที่อยู่อาศัยที่คาดการณ์ราคาบ้านโดยใช้ขนาด (พื้นที่เป็นตารางเมตร) จำนวนห้องนอน และสถานที่ตั้งทางภูมิศาสตร์เป็นฟีเจอร์
บ้านไม่สามารถเปลี่ยนแปลงสถานที่ตั้ง ขนาด หรือจํานวนห้องนอนได้อย่างรวดเร็วเพื่อตอบสนองต่อการคาดการณ์ราคา จึงทําให้ลูปความคิดเห็นไม่เกิดขึ้น อย่างไรก็ตาม อาจมีความสัมพันธ์ระหว่างขนาดและจํานวนห้องนอน (บ้านหลังใหญ่มีแนวโน้มที่จะมีพื้นที่ใช้สอยมากกว่า) ซึ่งอาจต้องแยกกันวิเคราะห์
โมเดลแอตทริบิวต์ใบหน้าที่ตรวจจับว่าบุคคลในรูปภาพยิ้มหรือไม่ ซึ่งได้รับการฝึกเป็นประจำในฐานข้อมูลภาพสต็อกที่อัปเดตโดยอัตโนมัติทุกเดือน
ไม่มีการป้อนกลับในขั้นตอนนี้ เนื่องจากการคาดการณ์ของโมเดลไม่มีผลต่อฐานข้อมูลรูปภาพ อย่างไรก็ตาม เวอร์ชันของข้อมูลอินพุตเป็นข้อกังวลในเรื่องนี้ เนื่องจากอัปเดตรายเดือนเหล่านี้อาจส่งผลต่อโมเดลในลักษณะที่ไม่คาดคิด