การฝังเป็นพื้นที่ที่มีขนาดค่อนข้างต่ําซึ่งคุณแปลเวกเตอร์ที่มีมิติสูงได้ การฝังช่วยให้ทําแมชชีนเลิร์นนิง กับอินพุตขนาดใหญ่ได้ง่ายขึ้น เช่น เวกเตอร์ที่กระจัดกระจายแสดงถึงคําต่างๆ ตามหลักการแล้ว การฝังควรรวบรวมความหมายของอินพุตบางส่วนโดยการวางอินพุตที่มีความหมายคล้ายกันไว้ใกล้ๆ กันในพื้นที่ฝัง การฝังช่วยให้คุณเรียนรู้ และนํามาใช้ซ้ําได้ในรูปแบบต่างๆ
การฝัง
แรงจูงใจจากการกรองแบบทํางานร่วมกัน
- อินพุต: ภาพยนตร์ 1,000,000 เรื่องที่ผู้ใช้เลือกดู 500,000 คน
- งาน: แนะนําภาพยนตร์ให้กับผู้ใช้
วิธีแก้ไขปัญหานี้จําเป็นต้องใช้วิธีการบางส่วนเพื่อพิจารณาว่าภาพยนตร์ใดภาพยนตร์เรื่องนี้คล้ายกัน
จัดระเบียบภาพยนตร์ตามความคล้ายคลึง (1 วัน)
การจัดระเบียบภาพยนตร์ตามความคล้ายคลึง (2D)
การฝังแบบ 2 มิติ
การฝังแบบ 2 มิติ
การฝังมิติข้อมูล d
- ถือว่าความสนใจของผู้ใช้ในภาพยนตร์อธิบายคร่าวๆ ได้หลายด้าน
- ภาพยนตร์แต่ละเรื่องจะกลายเป็นจุด D-D ที่ค่าในมิติข้อมูล D แสดงถึงจํานวนภาพยนตร์ที่พอดีกับมุมมองดังกล่าว
- คุณสามารถฝังข้อมูลได้จากแหล่งข้อมูล
การฝังการเรียนรู้ในเชิงลึก
- ไม่จําเป็นต้องมีกระบวนการฝึกแยกต่างหาก - เลเยอร์แบบฝังเป็นเพียงเลเยอร์ที่ซ่อนอยู่ซึ่งมี 1 หน่วยต่อมิติข้อมูล
- ข้อมูลที่มีการควบคุมดูแล (เช่น ผู้ใช้ดูภาพยนตร์ 2 เรื่องเรื่องเดียวกัน) จะปรับแต่งการฝังเนื้อหาที่เหมาะกับงานที่ต้องการ
- จะเห็นได้ว่าหน่วยที่ซ่อนอยู่แสดงวิธีจัดระเบียบรายการในพื้นที่ D-D ในลักษณะที่จะเพิ่มประสิทธิภาพสําหรับวัตถุประสงค์สุดท้ายได้ดีที่สุด
การป้อนข้อมูล
- ตัวอย่างแต่ละรายการ (แถวในเมทริกซ์นี้) เป็นเวกเตอร์ของคุณลักษณะ (ภาพยนตร์) ที่มีการดูเพียงเล็กน้อย
- การนําเสนอที่หนาแน่นของตัวอย่างนี้เป็น (0, 1, 0, 1, 0, 0, 0, 1)
ไม่มีประสิทธิภาพในด้านพื้นที่และเวลา
การป้อนข้อมูล
- สร้างพจนานุกรมพจนานุกรมสําหรับฟีเจอร์แต่ละรายการเป็นจํานวนเต็มตั้งแต่ 0, ..., # ภาพยนตร์ - 1
- นําเสนอเวกเตอร์ที่กระจัดกระจายอย่างมีประสิทธิภาพเพียงภาพยนตร์ที่ผู้ใช้ดู ซึ่งอาจแสดงเป็น
เลเยอร์แบบฝังในเครือข่ายที่ลึก
ปัญหาการเกิดปัญหาซ้ําเพื่อคาดการณ์ราคาขายของบ้าน
เลเยอร์แบบฝังในเครือข่ายที่ลึก
ปัญหาการเกิดปัญหาซ้ําเพื่อคาดการณ์ราคาขายของบ้าน
เลเยอร์แบบฝังในเครือข่ายที่ลึก
ปัญหาการเกิดปัญหาซ้ําเพื่อคาดการณ์ราคาขายของบ้าน
เลเยอร์แบบฝังในเครือข่ายที่ลึก
ปัญหาการเกิดปัญหาซ้ําเพื่อคาดการณ์ราคาขายของบ้าน
เลเยอร์แบบฝังในเครือข่ายที่ลึก
ปัญหาการเกิดปัญหาซ้ําเพื่อคาดการณ์ราคาขายของบ้าน
เลเยอร์แบบฝังในเครือข่ายที่ลึก
ปัญหาการเกิดปัญหาซ้ําเพื่อคาดการณ์ราคาขายของบ้าน
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การจัดประเภทแบบหลายคลาสเพื่อคาดการณ์ตัวเลขที่เขียนด้วยลายมือ
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
เลเยอร์แบบฝังในเครือข่ายที่ลึก
การกรองการทํางานร่วมกันเพื่อคาดการณ์ภาพยนตร์ที่จะแนะนํา:
ความสอดคล้องกับมุมมองเรขาคณิต
เครือข่ายเชิงลึก
- หน่วยที่ซ่อนแต่ละรายการจะสอดคล้องกับมิติข้อมูล (ฟีเจอร์แฝง)
- น้ําหนักของขอบระหว่างภาพยนตร์และเลเยอร์ที่ซ่อนอยู่เป็นค่าพิกัด
มุมมองเรขาคณิตของการฝังภาพยนตร์ 1 เรื่อง
การเลือกจํานวนการฝังที่ฝัง
- การฝังแบบมิติที่สูงขึ้นสามารถแสดงความสัมพันธ์ระหว่างค่าที่ป้อนได้แม่นยํามากขึ้น
- แต่มิติข้อมูลที่มากขึ้นจะเพิ่มโอกาสที่จะเกิดโอกาสมากเกินไปและนําไปสู่การฝึกที่ช้าลง
- หลักการทั่วไป (เป็นจุดเริ่มต้นที่ดี แต่ควรปรับแต่งโดยใช้ข้อมูลการตรวจสอบ) $$ dimensions \approx \sqrt[4]{possible\;values} $$
การฝังเป็นเครื่องมือ
- การฝังจะแมปรายการ (เช่น ภาพยนตร์ ข้อความ...) กับเวกเตอร์จริงที่มีมิติข้อมูลต่ําในลักษณะที่รายการคล้ายกันอยู่ใกล้กัน
- การฝังยังมีผลกับข้อมูลที่มีความหนาแน่น (เช่น เสียง) เพื่อสร้างเมตริกที่คล้ายกันที่มีความหมายได้ด้วย
- การฝังประเภทข้อมูลที่หลากหลายร่วมกัน (เช่น ข้อความ รูปภาพ เสียง...) จะกําหนดความคล้ายคลึงกันระหว่างข้อมูลแต่ละประเภท