ชุดข้อมูล การสรุปข้อมูล และการเพิ่มประสิทธิภาพมากเกินไป

บทนำ

โมดูลนี้เริ่มต้นด้วยคำถามนำ เลือกคำตอบใดคำตอบหนึ่งต่อไปนี้

ถ้าคุณจำเป็นต้องให้ความสำคัญกับการปรับปรุงด้านใดด้านหนึ่งต่อไปนี้ ในโปรเจ็กต์แมชชีนเลิร์นนิง ผลกระทบหรือไม่
การปรับปรุงคุณภาพชุดข้อมูล
ข้อมูลย่อมสำคัญกว่า คุณภาพและขนาดของชุดข้อมูลมีความสำคัญมากกว่าที่ อัลกอริทึมเงาสะท้อนที่คุณใช้สร้างโมเดล
การใช้ฟังก์ชันการสูญเสียที่ชาญฉลาดยิ่งขึ้นในการฝึกโมเดลของคุณ
จริง ฟังก์ชันการสูญเสียการแสดงผลที่ดีกว่าจะช่วยให้โมเดลฝึกได้เร็วขึ้น แต่ ก็ยังเป็นรองอีกรายการในรายการนี้

และต่อไปนี้เป็นคำถามหลัก

ลองเดาดูว่า ในโปรเจ็กต์แมชชีนเลิร์นนิงของคุณ ปกติแล้วคุณใช้เวลาในการเตรียมและเปลี่ยนรูปแบบข้อมูลไหม
มากกว่าครึ่งหนึ่งของเวลาโปรเจ็กต์
ใช่ ผู้ปฏิบัติงาน ML ใช้เวลาส่วนใหญ่ การสร้างชุดข้อมูล และการทำวิศวกรรมฟีเจอร์
ไม่ถึงครึ่งหนึ่งของเวลาโปรเจ็กต์
วางแผนรับประโยชน์เพิ่มเติม ปกติแล้ว 80% ของเวลาทั้งหมดที่ใช้แมชชีนเลิร์นนิง ใช้เวลาสร้างชุดข้อมูลและเปลี่ยนรูปแบบข้อมูล

ในโมดูลนี้ คุณจะได้เรียนรู้เกี่ยวกับลักษณะเฉพาะของแมชชีนเลิร์นนิงเพิ่มเติม ชุดข้อมูล และวิธีเตรียมข้อมูลเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพสูง จะฝึกอบรมและประเมินโมเดลของคุณ