ทดสอบความเข้าใจ

คำถามต่อไปนี้จะช่วยให้คุณเข้าใจแนวคิดหลักของ ML มากขึ้น

ความสามารถในการคาดการณ์

โมเดลแมชชีนเลิร์นนิงที่มีการควบคุมดูแลได้รับการฝึกโดยใช้ชุดข้อมูลที่มีตัวอย่างที่ติดป้ายกำกับ โมเดลจะเรียนรู้วิธีคาดการณ์ป้ายกำกับจากฟีเจอร์ อย่างไรก็ตาม ฟีเจอร์บางรายการในชุดข้อมูลอาจไม่มีความสามารถในการคาดการณ์ ในบางกรณี มีเพียงไม่กี่ฟีเจอร์ที่ทำหน้าที่เป็นตัวทำนายป้ายกำกับ ในชุดข้อมูลด้านล่าง ให้ใช้ราคาเป็นป้ายกำกับและคอลัมน์ที่เหลือเป็นฟีเจอร์

ตัวอย่างแอตทริบิวต์รถยนต์ที่มีป้ายกำกับ

คุณคิดว่าฟีเจอร์ 3 รายการใดมีแนวโน้มจะเป็นตัวทำนายราคารถยนต์ได้ดีที่สุด
Color, height, make_model
Tire_size, wheel_base, year
Make_model, year, miles
Miles, gearbox, make_model

การเรียนรู้แบบควบคุมดูแลและแบบไม่ควบคุมดูแล

คุณจะใช้แนวทางที่มีการควบคุมดูแลหรือไม่มีการควบคุมดูแล ทั้งนี้ขึ้นอยู่กับปัญหา เช่น หากทราบค่าหรือหมวดหมู่ที่ต้องการคาดการณ์ล่วงหน้า คุณจะใช้การเรียนรู้แบบควบคุม อย่างไรก็ตาม หากต้องการทราบว่าชุดข้อมูลของคุณมีการแบ่งกลุ่มหรือการจัดกลุ่มตัวอย่างที่เกี่ยวข้องหรือไม่ คุณจะใช้การเรียนรู้แบบไม่ควบคุม

สมมติว่าคุณมีชุดข้อมูลผู้ใช้สําหรับเว็บไซต์ช็อปปิ้งออนไลน์ และมีคอลัมน์ต่อไปนี้

รูปภาพของแถวแอตทริบิวต์ลูกค้า

หากต้องการทําความเข้าใจประเภทผู้ใช้ที่เข้าชมเว็บไซต์ คุณจะใช้การเรียนรู้แบบควบคุมหรือไม่ควบคุม
การเรียนรู้แบบควบคุมเนื่องจากเราพยายามคาดคะเนว่าผู้ใช้จัดอยู่ในคลาสใด
การเรียนรู้ที่ไม่มีการควบคุมดูแล

สมมติว่าคุณมีชุดข้อมูลการใช้พลังงานสําหรับบ้านที่มีคอลัมน์ต่อไปนี้

รูปภาพของแถวแอตทริบิวต์ของบ้าน

คุณจะใช้ ML ประเภทใดในการคาดการณ์กิโลวัตต์ชั่วโมงที่ใช้ต่อปีสำหรับบ้านหลังใหม่ที่สร้างขึ้น
การเรียนรู้ที่ไม่มีการควบคุมดูแล
การเรียนรู้ที่มีการควบคุมดูแล

สมมติว่าคุณมีชุดข้อมูลเที่ยวบินที่มีคอลัมน์ต่อไปนี้

รูปภาพแถวข้อมูลเที่ยวบิน

หากต้องการคาดการณ์ค่าตั๋วรถประจำทาง คุณจะใช้การถดถอยหรือการแยกประเภทไหม
การถดถอย
การจัดประเภท
คุณฝึกโมเดลการจัดประเภทเพื่อจัดประเภทค่าตั๋วรถประจำทางเป็น "สูง" "ปานกลาง" หรือ "ต่ำ" จากชุดข้อมูลได้ไหม
ไม่ได้ โมเดลการจัดประเภทจะคาดการณ์เพียง 2 หมวดหมู่ เช่น spam หรือ not_spam โมเดลนี้จะต้องคาดการณ์ 3 หมวดหมู่
ไม่ได้ คุณไม่สามารถสร้างโมเดลการจัดประเภทได้ ค่า coach_ticket_cost เป็นตัวเลข ไม่ใช่เชิงหมวดหมู่
ได้ แต่ก่อนอื่นเราต้องแปลงค่าตัวเลขในคอลัมน์ coach_ticket_cost เป็นค่าเชิงหมวดหมู่

การฝึกอบรมและการประเมิน

หลังจากฝึกโมเดลแล้ว เราจะประเมินโมเดลโดยใช้ชุดข้อมูลที่มีตัวอย่างที่ติดป้ายกำกับ และเปรียบเทียบค่าที่คาดการณ์ของโมเดลกับค่าจริงของป้ายกำกับ

เลือก 2 คำตอบที่ดีที่สุดสำหรับคำถาม

หากการคาดการณ์ของโมเดลไม่ตรงกับความเป็นจริง คุณอาจทําอย่างไรได้บ้างเพื่อปรับปรุงการคาดการณ์ให้ดีขึ้น
คุณไม่สามารถแก้ไขโมเดลที่มีการคาดการณ์ไม่ตรงความเป็นจริง
ลองใช้วิธีการฝึกอบรมแบบอื่น เช่น หากใช้วิธีการที่มีการควบคุมดูแล ให้ลองใช้วิธีการที่ไม่มีการควบคุมดูแล
ฝึกโมเดลอีกครั้ง แต่ใช้เฉพาะฟีเจอร์ที่คุณเชื่อว่ามีความสามารถคาดการณ์ได้ดีที่สุดสำหรับป้ายกำกับ
ฝึกโมเดลอีกครั้งโดยใช้ชุดข้อมูลขนาดใหญ่และหลากหลายมากขึ้น

ตอนนี้คุณก็พร้อมที่จะดำเนินการขั้นถัดไปในเส้นทาง ML แล้ว

  • คู่มือ People + AI หากคุณกำลังมองหาชุดวิธีการ แนวทางปฏิบัติแนะนำ และตัวอย่างที่นำเสนอโดย Googler, ผู้เชี่ยวชาญในอุตสาหกรรม และการวิจัยทางวิชาการสําหรับการใช้ ML

  • การกำหนดปัญหา หากคุณกําลังมองหาแนวทางที่ผ่านการทดสอบภาคสนามสําหรับการสร้างโมเดล ML และหลีกเลี่ยงข้อผิดพลาดที่พบบ่อย

  • หลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง หากคุณพร้อมที่จะเรียนรู้เพิ่มเติมเกี่ยวกับ ML อย่างละเอียดและลงมือปฏิบัติ