กระบวนการสําหรับการเตรียมข้อมูลและวิศวกรรมฟีเจอร์

กระบวนการดังกล่าวเป็นอย่างไร

อย่างที่ได้กล่าวไปแล้ว หลักสูตรนี้จะมุ่งเน้นไปที่การสร้างชุดข้อมูลและแปลงข้อมูล

การสร้างชุดข้อมูลประกอบด้วยงานต่อไปนี้ 1. เก็บข้อมูลดิบ  2. ระบุแหล่งที่มาของฟีเจอร์และป้ายกํากับ 3. เลือกกลยุทธ์การสุ่มตัวอย่าง
4. แยกข้อมูล การแปลงข้อมูลประกอบด้วยงานต่อไปนี้
1. สํารวจและล้างข้อมูล 2. ทําวิศวกรรมฟีเจอร์

ข้อควรทราบมีดังนี้

  • ตัวเลขนี้แสดงกระบวนการทั่วไป ซึ่งอาจไม่เหมาะกับทุกโปรเจ็กต์ หลักสูตรนี้จะใช้กับการถดถอยเชิงเส้นและโครงข่ายสุทธิเป็นหลัก
  • ขั้นตอนที่แสดงไม่ได้ตามลําดับเสมอไป ตัวอย่างเช่น คุณอาจแบ่งข้อมูลหลังจากที่แปลงข้อมูลแล้ว คุณอาจต้องรวบรวมข้อมูลมากขึ้น คุณอาจจําเป็นต้องแก้ไขชุดฟีเจอร์ แม้ว่าจะเริ่มต้นการฝึกอบรมไปแล้วก็ตาม ขณะที่คุณเรียนรู้อย่างมากว่าสิ่งใดที่ได้ผลและอะไรไม่ได้ผล

ใช้เวลานานแค่ไหนครับ

สําหรับคําถามต่อไปนี้ ให้คลิกลูกศรที่ต้องการเพื่อตรวจคําตอบ

ลองเดาดูสิว่าโดยทั่วไปแล้วโปรเจ็กต์แมชชีนเลิร์นนิงของคุณจะใช้เวลาเท่าไรในการเตรียมตัวและการเปลี่ยนรูปแบบข้อมูล
มากกว่าครึ่งหนึ่งของเวลาโครงการ
ถูกต้อง: คุณจะได้ใช้เวลาส่วนใหญ่ไปกับโปรเจ็กต์แมชชีนเลิร์นนิงที่สร้างชุดข้อมูลและเปลี่ยนรูปแบบข้อมูล
น้อยกว่าครึ่งหนึ่งของเวลาโครงการ
วางแผนเพื่อรับส่วนลดเพิ่มเติม โดยทั่วไป 80% ของเวลาทั้งหมดในโปรเจ็กต์แมชชีนเลิร์นนิงจะใช้ในการสร้างชุดข้อมูลและเปลี่ยนรูปแบบข้อมูล