แมชชีนเลิร์นนิง (ML) ขับเคลื่อนเทคโนโลยีที่สำคัญที่สุดบางอย่างที่เราใช้ ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะอัตโนมัติ หลักสูตรนี้จะอธิบายแนวคิดหลัก ที่อยู่เบื้องหลัง ML
ML เป็นวิธีใหม่ในการแก้ปัญหา ตอบคำถามที่ซับซ้อน และสร้างเนื้อหาใหม่ ML สามารถพยากรณ์อากาศ คาดคะเนเวลาเดินทาง แนะนำเพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้างรูปภาพที่ไม่เคยเห็นมาก่อน
กล่าวโดยง่าย ML คือกระบวนการฝึกซอฟต์แวร์ชิ้นหนึ่งที่เรียกว่าโมเดล เพื่อสร้างการคาดการณ์ที่เป็นประโยชน์หรือสร้างเนื้อหา (เช่น ข้อความ รูปภาพ เสียง หรือวิดีโอ) จากข้อมูล
ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปเพื่อคาดการณ์ปริมาณน้ำฝน เราอาจ ใช้วิธีการแบบดั้งเดิมหรือวิธีการ ML ก็ได้ หากใช้แนวทางแบบเดิม เราจะต้องสร้างการแสดงชั้นบรรยากาศ และพื้นผิวของโลกตามหลักฟิสิกส์ และคำนวณสมการพลศาสตร์ของไหลจำนวนมหาศาล ซึ่งเป็นเรื่องที่ ยากมาก
การใช้แนวทาง ML เราจะให้ข้อมูลสภาพอากาศจำนวนมหาศาลแก่โมเดล ML จนกว่าโมเดล ML จะเรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่าง รูปแบบสภาพอากาศที่ทำให้เกิดปริมาณฝนที่แตกต่างกัน จากนั้นเราจะให้ข้อมูลสภาพอากาศปัจจุบันแก่โมเดล และโมเดลจะคาดการณ์ปริมาณฝน
ทดสอบความเข้าใจ
ประเภทของระบบ ML
ระบบ ML จะอยู่ในหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ โดยขึ้นอยู่กับวิธีที่ระบบ เรียนรู้ที่จะทำการคาดการณ์หรือสร้างเนื้อหา
- การเรียนรู้ที่มีการควบคุมดูแล
- การเรียนรู้ที่ไม่มีการควบคุมดูแล
- การเรียนรู้แบบเสริมกำลัง
- Generative AI
การเรียนรู้ที่มีการควบคุมดูแล
โมเดลการเรียนรู้ภายใต้การควบคุมดูแล สามารถทําการคาดการณ์ได้หลังจากเห็นข้อมูลจํานวนมากที่มีคําตอบที่ถูกต้อง และค้นพบความเชื่อมโยงระหว่างองค์ประกอบในข้อมูลที่ สร้างคําตอบที่ถูกต้อง ซึ่งคล้ายกับการที่นักเรียนเรียนรู้เนื้อหาใหม่โดย ศึกษาข้อสอบเก่าที่มีทั้งคำถามและคำตอบ เมื่อนักเรียน ฝึกทำข้อสอบเก่ามากพอแล้ว นักเรียนก็จะพร้อมทำข้อสอบใหม่ ระบบ ML เหล่านี้ได้รับการ "กำกับดูแล" ในแง่ที่ว่ามนุษย์จะให้ข้อมูลแก่ระบบ ML พร้อมผลลัพธ์ที่ถูกต้องซึ่งทราบกันดี
กรณีการใช้งานที่พบบ่อยที่สุด 2 กรณีสำหรับการเรียนรู้แบบมีผู้ดูแลคือการถดถอยและ การจัดประเภท
การถดถอย
โมเดลการถดถอยจะคาดการณ์ค่าตัวเลข ตัวอย่างเช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณน้ำฝนเป็นนิ้วหรือมิลลิเมตรคือโมเดลการถดถอย
ดูตัวอย่างโมเดลการถดถอยเพิ่มเติมได้ในตารางด้านล่าง
สถานการณ์ | ข้อมูลอินพุตที่เป็นไปได้ | การคาดการณ์ตัวเลข |
---|---|---|
ราคาบ้านในอนาคต | พื้นที่ในหน่วยตารางฟุต รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดที่ดิน อัตราดอกเบี้ยจำนอง อัตราภาษีที่ดิน ค่าก่อสร้าง และ จำนวนบ้านที่ประกาศขายในพื้นที่ | ราคาของบ้าน |
เวลาการเดินทางในอนาคต | สภาพการจราจรในอดีต (รวบรวมจากสมาร์ทโฟน เซ็นเซอร์การจราจร แอปเรียกรถและแอปนำทางอื่นๆ) ระยะทางจากจุดหมาย และสภาพอากาศ | เวลาเป็นนาทีและวินาทีในการเดินทางถึงจุดหมาย |
การจัดประเภท
โมเดลการจัดประเภทคาดการณ์ ความเป็นไปได้ที่สิ่งหนึ่งๆ จะอยู่ในหมวดหมู่หนึ่งๆ โมเดลการจัดประเภทจะแสดงค่าที่ระบุว่ามีสิ่งใดอยู่ในหมวดหมู่หนึ่งๆ หรือไม่ ซึ่งแตกต่างจากโมเดลการถดถอย ที่เอาต์พุตเป็นตัวเลข ตัวอย่างเช่น โมเดลการจัดประเภทใช้เพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือไม่ หรือรูปภาพ มีแมวหรือไม่
โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารีและการจัดประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงค่าจาก
คลาสที่มีค่าเพียง 2 ค่า เช่น โมเดลที่แสดงผลเป็น rain
หรือ no rain
โมเดลการแยกประเภทแบบหลายคลาสจะแสดงค่าจากคลาสที่มีค่ามากกว่า 2 ค่า เช่น โมเดลที่แสดงค่าเป็น rain
, hail
, snow
หรือ sleet
ทดสอบความเข้าใจ
การเรียนรู้ที่ไม่มีการควบคุมดูแล
โมเดลการเรียนรู้แบบไม่มีการควบคุมดูแล จะทำการคาดการณ์โดยรับข้อมูลที่ไม่มีคำตอบที่ถูกต้อง เป้าหมายของโมเดลการเรียนรู้แบบไม่มีการกำกับดูแลคือการระบุรูปแบบที่มีความหมายในข้อมูล กล่าวคือ โมเดลไม่มีคำแนะนำเกี่ยวกับวิธีจัดหมวดหมู่ข้อมูลแต่ละชิ้น แต่ต้องอนุมานกฎของตัวเองแทน
โมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลที่ใช้กันโดยทั่วไปจะใช้เทคนิคที่เรียกว่าการจัดกลุ่ม โมเดลจะค้นหาจุดข้อมูล ที่กำหนดการจัดกลุ่มตามธรรมชาติ

รูปที่ 1 โมเดล ML ที่จัดกลุ่มจุดข้อมูลที่คล้ายกัน

รูปที่ 2 กลุ่มของคลัสเตอร์ที่มีการแบ่งเขตตามธรรมชาติ
การจัดกลุ่มแตกต่างจากการจัดประเภทเนื่องจากหมวดหมู่ไม่ได้กำหนดโดยคุณ ตัวอย่างเช่น โมเดลแบบไม่มีการกำกับดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศตามอุณหภูมิ ซึ่งเผยให้เห็นการแบ่งกลุ่มที่กำหนดฤดูกาล จากนั้นคุณอาจ พยายามตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจในชุดข้อมูล

รูปที่ 3 โมเดล ML ที่จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน

รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่มีป้ายกำกับเป็นหิมะ ลูกเห็บ ฝน และไม่มีฝน
ทดสอบความเข้าใจ
การเรียนรู้แบบเสริมกำลัง
โมเดลการเรียนรู้แบบเสริมกำลัง จะทำการคาดการณ์โดยรับรางวัล หรือบทลงโทษตามการกระทำที่ดำเนินการภายในสภาพแวดล้อม ระบบการเรียนรู้แบบเสริมกำลัง จะสร้างนโยบายที่ กำหนดกลยุทธ์ที่ดีที่สุดในการรับรางวัลมากที่สุด
การเรียนรู้แบบเสริมกำลังใช้ในการฝึกหุ่นยนต์ให้ทำงานต่างๆ เช่น เดิน ไปรอบๆ ห้อง และโปรแกรมซอฟต์แวร์อย่าง AlphaGo เพื่อเล่นเกมโกะ
Generative AI
Generative AI คือโมเดลประเภทหนึ่ง ที่สร้างเนื้อหาจากข้อมูลที่ผู้ใช้ป้อน เช่น Generative AI สามารถสร้าง รูปภาพ เพลง และมุกตลกที่ไม่ซ้ำใคร สรุปบทความ อธิบายวิธีทำงาน หรือแก้ไขรูปภาพ
Generative AI สามารถรับอินพุตได้หลากหลายและสร้างเอาต์พุตได้หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ นอกจากนี้ยังสามารถใช้และสร้างชุดค่าผสมของ ค่าเหล่านี้ได้ด้วย เช่น โมเดลสามารถรับรูปภาพเป็นอินพุตและสร้างรูปภาพและข้อความเป็นเอาต์พุต หรือรับรูปภาพและข้อความเป็นอินพุตและสร้างวิดีโอเป็นเอาต์พุต
เราสามารถพูดถึงโมเดล Generative ได้โดยพิจารณาจากอินพุตและเอาต์พุต ซึ่งมักจะเขียนเป็น "ประเภทอินพุต" เป็น "ประเภทเอาต์พุต" ตัวอย่างเช่น รายการต่อไปนี้เป็นรายการอินพุตและเอาต์พุตบางส่วนสำหรับโมเดล Generative
- ข้อความเป็นข้อความ
- การเปลี่ยนข้อความเป็นรูปภาพ
- เปลี่ยนข้อความเป็นวิดีโอ
- เปลี่ยนข้อความเป็นโค้ด
- การอ่านออกเสียงข้อความ
- รูปภาพและข้อความเป็นรูปภาพ
ตารางต่อไปนี้แสดงตัวอย่างโมเดล Generative, อินพุต และเอาต์พุตที่เป็นไปได้
รุ่น | อินพุต | ตัวอย่างเอาต์พุต |
---|---|---|
ข้อความเป็นข้อความ | ใครเป็นผู้คิดค้นการแข่งขัน Le Mans |
การแข่งขัน 24 Hours of Le Mans ก่อตั้งขึ้นโดย Automobile Club de l'Ouest
(ACO) ซึ่งเป็นองค์กรด้านยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้น
ในวันที่ 26 และ 27 พฤษภาคม 1923 ที่สนามแข่งซาร์ต ซึ่งเป็นสนามแข่งบนถนนยาว 13.426 กิโลเมตร
(8.345 ไมล์) ใกล้กับเมืองเลอม็องในฝรั่งเศส
การแข่งขันนี้มีแนวคิดเริ่มแรกเพื่อโปรโมต ACO และแคว้นซาร์ต
แหล่งที่มา: Bard |
การเปลี่ยนข้อความเป็นรูปภาพ | ปลาหมึกต่างดาวลอยผ่านพอร์ทัลขณะอ่านหนังสือพิมพ์ |
![]() แหล่งที่มา: Imagen |
เปลี่ยนข้อความเป็นวิดีโอ | ตุ๊กตาหมีเหมือนจริงกำลังว่ายน้ำในมหาสมุทรที่ซานฟรานซิสโก หมีเท็ดดี้ดำน้ำ ตุ๊กตาหมีว่ายน้ำอยู่ใต้น้ำกับปลาสีสันสดใส หมีแพนด้ากำลังว่ายน้ำอยู่ใต้น้ำ |
![]() แหล่งที่มา: Phenaki |
เปลี่ยนข้อความเป็นโค้ด | เขียนลูป Python ที่วนซ้ำในรายการตัวเลขและพิมพ์จำนวนเฉพาะ |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) แหล่งที่มา: Bard |
รูปภาพเป็นข้อความ | ![]() |
นี่คือนกฟลามิงโก โดยพบในแคริบเบียน แหล่งที่มา: Google DeepMind |
Generative AI ทำงานอย่างไร ในภาพรวม โมเดล Generative จะเรียนรู้รูปแบบในข้อมูลโดยมีเป้าหมายเพื่อสร้างข้อมูลใหม่ที่คล้ายกัน โมเดล Generative มีลักษณะดังนี้
- นักแสดงตลกที่เรียนรู้การเลียนแบบผู้อื่นด้วยการสังเกตพฤติกรรมและ สไตล์การพูดของคน
- ศิลปินที่เรียนรู้การวาดภาพในสไตล์หนึ่งๆ โดยการศึกษาภาพวาดจำนวนมากในสไตล์นั้น
- วงคัฟเวอร์ที่ฝึกฝนให้มีเสียงเหมือนวงดนตรีที่เฉพาะเจาะจงโดยการฟังเพลงของวงนั้นๆ เป็นจำนวนมาก
โมเดล Generative จะได้รับการฝึกเบื้องต้นโดยใช้วิธีการแบบไม่มีการกำกับดูแล ซึ่งโมเดลจะเรียนรู้ที่จะเลียนแบบข้อมูลที่ใช้ฝึก เพื่อสร้างเอาต์พุตที่ไม่ซ้ำกันและสร้างสรรค์ บางครั้งระบบจะฝึกโมเดลเพิ่มเติมโดยใช้การเรียนรู้แบบมีผู้ดูแลหรือการเรียนรู้แบบเสริมกำลังในข้อมูลที่เฉพาะเจาะจงซึ่งเกี่ยวข้องกับงานที่อาจมีการขอให้โมเดลทำ เช่น สรุปบทความหรือแก้ไขรูปภาพ
Generative AI เป็นเทคโนโลยีที่เปลี่ยนแปลงอย่างรวดเร็ว และมีการค้นพบกรณีการใช้งานใหม่ๆ อยู่เสมอ ตัวอย่างเช่น โมเดล Generative ช่วยให้ธุรกิจปรับแต่งรูปภาพผลิตภัณฑ์อีคอมเมิร์ซได้โดยการนำพื้นหลังที่รบกวนออกโดยอัตโนมัติหรือปรับปรุงคุณภาพของรูปภาพที่มีความละเอียดต่ำ