แมชชีนเลิร์นนิง (ML) เป็นเทคโนโลยีสําคัญที่สุดอย่างหนึ่งที่เราใช้ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะไร้คนขับ หลักสูตรนี้จะอธิบายแนวคิดหลักที่อยู่เบื้องหลัง ML
ML เป็นวิธีใหม่ในการแก้ปัญหา ตอบคําถามที่ซับซ้อน และสร้างเนื้อหาใหม่ ML สามารถคาดการณ์สภาพอากาศ ประมาณเวลาเดินทาง แนะนำเพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้างรูปภาพที่ไม่เคยเห็นมาก่อน
พูดง่ายๆ ก็คือ ML คือกระบวนการฝึกซอฟต์แวร์ที่เรียกว่าโมเดลเพื่อทำการคาดการณ์ที่เป็นประโยชน์หรือสร้างเนื้อหาจากข้อมูล
ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปพยากรณ์ฝน เราอาจใช้แนวทางแบบดั้งเดิมหรือแนวทาง ML ก็ได้ เมื่อใช้แนวทางแบบดั้งเดิม เราจะสร้างการนำเสนอบรรยากาศและพื้นผิวของโลกตามหลักการทางฟิสิกส์ โดยคำนวณสมการของพลศาสตร์ของไหลจํานวนมหาศาล ซึ่งเป็นเรื่องที่ยากมาก
เมื่อใช้แนวทาง ML เราจะให้ข้อมูลสภาพอากาศจํานวนมหาศาลแก่โมเดล ML จนกว่าโมเดล ML จะเรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่างรูปแบบสภาพอากาศที่ทำให้เกิดปริมาณฝนที่แตกต่างกัน จากนั้นเราจะป้อนข้อมูลสภาพอากาศปัจจุบันให้กับโมเดล แล้วโมเดลจะคาดการณ์ปริมาณฝน
ทดสอบความเข้าใจ
ประเภทของระบบ ML
ระบบ ML แบ่งออกเป็นหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ตามวิธีที่ระบบเรียนรู้เพื่อทำนายหรือสร้างเนื้อหา
- การเรียนรู้ที่มีการควบคุมดูแล
- การเรียนรู้ที่ไม่มีการควบคุมดูแล
- การเรียนรู้แบบเสริมกำลัง
- Generative AI
การเรียนรู้ที่มีการควบคุมดูแล
โมเดลการเรียนรู้ที่มีการควบคุมดูแลสามารถคาดการณ์ได้หลังจากเห็นข้อมูลจํานวนมากที่มีคําตอบที่ถูกต้อง แล้วค้นพบความสัมพันธ์ระหว่างองค์ประกอบในข้อมูลที่ให้คําตอบที่ถูกต้อง การดำเนินการนี้เหมือนกับนักเรียนเรียนรู้เนื้อหาใหม่โดยการศึกษาข้อสอบเก่าซึ่งมีทั้งคำถามและคำตอบ เมื่อนักเรียนฝึกทำข้อสอบเก่าๆ มากพอแล้ว นักเรียนก็พร้อมที่จะทำข้อสอบใหม่ ระบบ ML เหล่านี้เป็นระบบ "ที่มีการควบคุมดูแล" ในแง่ที่มนุษย์ให้ข้อมูลกับระบบ ML โดยมีผลลัพธ์ที่ถูกต้องซึ่งทราบอยู่แล้ว
กรณีการใช้งานที่พบบ่อยที่สุด 2 รายการสําหรับการเรียนรู้แบบควบคุมคือ การหาค่าสัมประสิทธิ์การถดถอยและการแยกประเภท
การถดถอย
โมเดลการถดถอยจะคาดการณ์ค่าตัวเลข เช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณน้ำฝนเป็นนิ้วหรือมิลลิเมตรคือโมเดลการถดถอย
ดูตัวอย่างเพิ่มเติมของโมเดลการถดถอยได้ในตารางด้านล่าง
สถานการณ์ | ข้อมูลอินพุตที่เป็นไปได้ | การคาดคะเนตัวเลข |
---|---|---|
ราคาบ้านในอนาคต | พื้นที่ใช้สอย รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดแปลงที่ดิน อัตราดอกเบี้ยสินเชื่อ อัตราภาษีอสังหาริมทรัพย์ ค่าใช้จ่ายในการก่อสร้าง และจำนวนบ้านที่ขายในบริเวณนั้น | ราคาบ้าน |
เวลาเรียกรถในอนาคต | สภาพการจราจรที่ผ่านมา (รวบรวมจากสมาร์ทโฟน เซ็นเซอร์การจราจร แอปพลิเคชันเรียกรถและการนำทางอื่นๆ) ระยะทางจากจุดหมาย และสภาพอากาศ | เวลาเป็นนาทีและวินาทีที่ใช้ในการไปถึงจุดหมาย |
การจัดประเภท
โมเดลการจัดประเภทจะคาดการณ์ความเป็นไปได้ที่สิ่งหนึ่งๆ จะอยู่ในหมวดหมู่ ซึ่งแตกต่างจากโมเดลการถดถอยที่เอาต์พุตเป็นตัวเลข โมเดลการจัดประเภทจะแสดงผลค่าที่ระบุว่ารายการหนึ่งๆ อยู่ในหมวดหมู่หนึ่งๆ หรือไม่ เช่น ระบบจะใช้โมเดลการจัดประเภทเพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือไม่ หรือรูปภาพมีแมวหรือไม่
โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารีและการจัดประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงผลค่าจากคลาสที่มีเพียง 2 ค่า เช่น โมเดลที่แสดงผล rain
หรือ no rain
โมเดลการจัดประเภทหลายคลาสจะแสดงผลค่าจากคลาสที่มีค่ามากกว่า 2 ค่า เช่น โมเดลที่แสดงผลได้ rain
, hail
, snow
หรือ sleet
ทดสอบความเข้าใจ
การเรียนรู้ที่ไม่มีการควบคุมดูแล
โมเดลการเรียนรู้แบบไม่ควบคุมดูแลจะทำการคาดการณ์โดยได้รับข้อมูลที่ไม่มีคําตอบที่ถูกต้อง เป้าหมายของโมเดลการเรียนรู้แบบไม่ควบคุมดูแลคือการระบุรูปแบบที่มีความหมายในข้อมูล กล่าวคือ โมเดลไม่มีคำแนะนำเกี่ยวกับวิธีจัดหมวดหมู่ข้อมูลแต่ละรายการ แต่ต้องอนุมานกฎของตนเอง
โมเดลการเรียนรู้แบบไม่ควบคุมที่ใช้กันโดยทั่วไปจะใช้เทคนิคที่เรียกว่าการจัดกลุ่ม โมเดลจะค้นหาจุดข้อมูลที่กําหนดขอบเขตการจัดกลุ่มตามธรรมชาติ
![รูปภาพที่แสดงจุดสีเป็นกลุ่ม](https://developers.google.cn/static/machine-learning/intro-to-ml/images/clustering-02.png?authuser=6&hl=th)
รูปที่ 1 โมเดล ML จัดกลุ่มจุดข้อมูลที่คล้ายกัน
![รูปภาพที่แสดงจุดสีเป็นกลุ่มๆ ที่ล้อมรอบด้วยรูปร่างและอยู่ติดกัน](https://developers.google.cn/static/machine-learning/intro-to-ml/images/clustering-04.png?authuser=6&hl=th)
รูปที่ 2 กลุ่มคลัสเตอร์ที่มีขอบเขตตามธรรมชาติ
การคลัสเตอร์แตกต่างจากการจัดประเภทเนื่องจากคุณไม่ได้เป็นผู้กําหนดหมวดหมู่ เช่น โมเดลที่ไม่มีการควบคุมดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศตามอุณหภูมิ ซึ่งจะแสดงการแบ่งกลุ่มที่กําหนดฤดูกาล จากนั้นคุณอาจลองตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจของคุณเกี่ยวกับชุดข้อมูล
![รูปภาพที่แสดงจุดสีเป็นกลุ่มๆ ที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน](https://developers.google.cn/static/machine-learning/intro-to-ml/images/clustering-01.png?authuser=6&hl=th)
รูปที่ 3 โมเดล ML ที่จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน
![รูปภาพที่แสดงจุดสีเป็นกลุ่มๆ ที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน ซึ่งอยู่ในรูปทรงหนึ่งๆ และอยู่ติดกัน](https://developers.google.cn/static/machine-learning/intro-to-ml/images/clustering-03.png?authuser=6&hl=th)
รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่ติดป้ายกำกับว่าหิมะ น้ำแข็งผสมกับฝน ฝน และไม่ฝน
ทดสอบความเข้าใจ
การเรียนรู้แบบเสริมกำลัง
โมเดลการเรียนรู้เพื่อเสริมแรงจะทําการคาดการณ์โดยรับรางวัลหรือบทลงโทษตามการดําเนินการภายในสภาพแวดล้อม ระบบการเรียนรู้ด้วยการทำซ้ำจะสร้างนโยบายที่กําหนดกลยุทธ์ที่ดีที่สุดเพื่อให้ได้รับรางวัลมากที่สุด
การเรียนรู้ด้วยการทำซ้ำใช้เพื่อฝึกหุ่นยนต์ให้ทำงานต่างๆ เช่น การเดินไปรอบๆ ห้อง และโปรแกรมซอฟต์แวร์อย่าง AlphaGo เพื่อเล่นเกมโกะ
Generative AI
Generative AI คือคลาสของโมเดลที่สร้างเนื้อหาจากข้อมูลที่ผู้ใช้ป้อน เช่น Generative AI สามารถสร้างรูปภาพ การแต่งเพลง และมุกตลกที่ไม่เหมือนใคร รวมถึงสรุปบทความ อธิบายวิธีทำงาน หรือแก้ไขรูปภาพ
Generative AI สามารถใช้อินพุตที่หลากหลายเพื่อสร้างเอาต์พุตที่หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ รวมถึงสร้างชุดค่าผสมของข้อมูลเหล่านี้ได้ด้วย เช่น โมเดลอาจใช้รูปภาพเป็นอินพุตและสร้างรูปภาพและข้อความเป็นเอาต์พุต หรือใช้รูปภาพและข้อความเป็นอินพุตและสร้างวิดีโอเป็นเอาต์พุต
เราอาจพูดถึงโมเดล Generative ตามอินพุตและเอาต์พุต ซึ่งโดยทั่วไปจะเขียนเป็น "ประเภทอินพุต"-"ประเภทเอาต์พุต" ตัวอย่างเช่น รายการต่อไปนี้เป็นรายการอินพุตและเอาต์พุตบางส่วนของโมเดล Generative
- การแปลงข้อความเป็นข้อความ
- การเปลี่ยนข้อความเป็นรูปภาพ
- เปลี่ยนข้อความเป็นวิดีโอ
- การเปลี่ยนข้อความเป็นโค้ด
- การอ่านออกเสียงข้อความ
- รูปภาพและการเปลี่ยนข้อความเป็นรูปภาพ
ตารางต่อไปนี้แสดงตัวอย่างโมเดล Generative, อินพุตของโมเดล และตัวอย่างเอาต์พุตที่เป็นไปได้
รุ่น | อินพุต | ตัวอย่างเอาต์พุต |
---|---|---|
การแปลงข้อความเป็นข้อความ | ใครเป็นผู้คิดค้นการแข่งขัน Le Mans |
การแข่งขัน 24 Hours of Le Mans ก่อตั้งโดย Automobile Club de l'Ouest (ACO) ซึ่งเป็นองค์กรยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้นในวันที่ 26 และ 27 พฤษภาคม 1923 ที่ Sarthe Circuit ซึ่งเป็นสนามแข่งบนถนนระยะทาง 13.426 กิโลเมตร (8.345 ไมล์) ที่อยู่ใกล้กับเมืองเลอ ม็องส์ในฝรั่งเศส
การแข่งขันนี้เริ่มขึ้นเพื่อโปรโมต ACO และภูมิภาค Sarthe แหล่งที่มา: Bard |
การเปลี่ยนข้อความเป็นรูปภาพ | ปลาหมึกต่างดาวลอยผ่านพอร์ทัลขณะอ่านหนังสือพิมพ์ |
![]() แหล่งที่มา: Imagen |
เปลี่ยนข้อความเป็นวิดีโอ | ตุ๊กตาหมีที่ดูเหมือนจริงกำลังว่ายน้ำในมหาสมุทรที่ซานฟรานซิสโก หมีเท็ดดี้ลงไปใต้น้ำ ตุ๊กตาหมีว่ายน้ำใต้น้ำไปเรื่อยๆ พร้อมกับปลาหลากสี หมีแพนด้ากำลังว่ายน้ำใต้น้ำ |
![]() แหล่งที่มา: Phenaki |
การเปลี่ยนข้อความเป็นโค้ด | เขียนลูป Python ที่วนซ้ำรายการตัวเลขและพิมพ์จำนวนเฉพาะ |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) แหล่งที่มา: Bard |
การแปลงรูปภาพเป็นข้อความ | ![]() |
นี่คือนกฟลามิงโก พบในทะเลแคริบเบียน แหล่งที่มา: Google DeepMind |
Generative AI ทำงานอย่างไร ในระดับสูง โมเดล Generative จะเรียนรู้รูปแบบในข้อมูลโดยมีเป้าหมายเพื่อสร้างข้อมูลใหม่แต่คล้ายกัน โมเดล Generative มีลักษณะดังนี้
- นักแสดงตลกที่เรียนรู้ที่จะเลียนแบบผู้อื่นด้วยการสังเกตพฤติกรรมและรูปแบบการพูดของผู้คน
- ศิลปินที่เรียนรู้การวาดภาพในสไตล์หนึ่งๆ โดยการศึกษาภาพวาดจำนวนมากในสไตล์นั้น
- วงดนตรีที่คัฟเวอร์เพลงของวงอื่นโดยพยายามเลียนแบบเสียงของวงนั้นๆ ด้วยการฟังเพลงของวงนั้นๆ เป็นจำนวนมาก
โมเดล Generative ได้รับการฝึกฝนโดยใช้วิธีการแบบไม่ควบคุมดูแลตั้งแต่แรก เพื่อให้ได้เอาต์พุตที่ไม่เหมือนใครและสร้างสรรค์ โดยโมเดลจะเรียนรู้ที่จะเลียนแบบข้อมูลที่ใช้ฝึก บางครั้งระบบจะฝึกโมเดลเพิ่มเติมโดยใช้การเรียนรู้แบบควบคุมหรือการเรียนรู้ด้วยการทำซ้ำกับข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่ระบบอาจขอให้โมเดลดำเนินการ เช่น สรุปบทความหรือแก้ไขรูปภาพ
Generative AI เป็นเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็ว โดยมีกรณีการใช้งานใหม่ๆ ค้นพบอยู่เสมอ เช่น โมเดล Generative ช่วยให้ธุรกิจปรับแต่งรูปภาพผลิตภัณฑ์อีคอมเมิร์ซได้โดยอัตโนมัติด้วยการนําพื้นหลังที่รบกวนออก หรือปรับปรุงคุณภาพของรูปภาพที่มีความละเอียดต่ำ