แมชชีนเลิร์นนิง (ML) เป็นตัวขับเคลื่อนเทคโนโลยีที่สำคัญที่สุดที่เราใช้ ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะแบบไร้คนขับ หลักสูตรนี้จะอธิบายถึงหัวใจสำคัญ แนวคิดเบื้องหลัง ML
ML นำเสนอวิธีใหม่ในการแก้ไขปัญหา ตอบคำถามที่ซับซ้อน และสร้างสรรค์เนื้อหาใหม่ๆ เนื้อหา ML สามารถคาดการณ์สภาพอากาศ ประมาณเวลาเดินทาง แนะนำ เพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้าง รูปภาพที่ไม่เคยเห็นมาก่อน
พูดง่ายๆ ก็คือ ML เป็นกระบวนการของ การฝึกอบรมเกี่ยวกับซอฟต์แวร์ ซึ่งเรียกว่า model เพื่อให้มีประโยชน์ การคาดคะเนหรือสร้างเนื้อหาจาก
ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปเพื่อคาดการณ์ปริมาณฝน เราสามารถ ใช้แนวทางแบบดั้งเดิมหรือแนวทาง ML ใช้ข้อความดั้งเดิม เราจะสร้างการนำเสนอชั้นบรรยากาศของโลกโดยอ้างอิงตามหลักฟิสิกส์ และพื้นผิว คำนวณสมการไดนามิกของไหลจำนวนมหาศาล นี่คือ ยากเหลือเชื่อ
ในการใช้แนวทาง ML เราจะให้ข้อมูลสภาพอากาศแก่โมเดล ML จำนวนมหาศาล จนกว่าโมเดล ML จะได้เรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่าง รูปแบบสภาพอากาศที่ทำให้เกิดปริมาณน้ำฝนที่แตกต่างกัน จากนั้นเราจะให้ สร้างแบบจำลองข้อมูลสภาพอากาศปัจจุบัน และคาดการณ์ปริมาณน้ำฝน
ตรวจสอบความเข้าใจ
ประเภทระบบ ML
ระบบ ML จะจัดอยู่ในหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ตามลักษณะ เรียนรู้วิธีคาดการณ์หรือสร้างเนื้อหา
- การเรียนรู้ที่มีการควบคุมดูแล
- การเรียนรู้แบบไม่มีการควบคุมดูแล
- การเรียนรู้แบบเสริมกำลัง
- Generative AI
การเรียนรู้ที่มีการควบคุมดูแล
การเรียนรู้แบบมีการควบคุมดูแล โมเดลก็สามารถคาดการณ์ได้หลังจากเห็นข้อมูลจำนวนมากพร้อมคำตอบที่ถูกต้อง จากนั้นก็ค้นพบความเชื่อมโยงระหว่างองค์ประกอบต่างๆ ในข้อมูลที่ จะให้คำตอบที่ถูกต้อง ซึ่งเหมือนกับการเรียนรู้สื่อการเรียนการสอนใหม่ของนักเรียนโดย การเรียนการสอบเก่าๆ ที่มีทั้งคำถามและคำตอบ เมื่อนักเรียนมี ได้รับการฝึกอบรมจากข้อสอบเก่าจำนวนมากพอ นักเรียนก็พร้อมจะทำข้อสอบใหม่ ระบบ ML เหล่านี้มี "การควบคุมดูแล" ในแง่ของการที่มนุษย์ทำให้ระบบ ML ซึ่งมีผลลัพธ์ที่ถูกต้องที่ทราบ
กรณีการใช้งานที่พบบ่อยที่สุด 2 กรณีสำหรับการเรียนรู้ภายใต้การควบคุมดูแลคือการถดถอยและ การจำแนกประเภท
การถดถอย
โมเดลการถดถอยคาดการณ์ ที่เป็นตัวเลข ตัวอย่างเช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณน้ำฝนใน นิ้วหรือมิลลิเมตรเป็นโมเดลการถดถอย
ดูตัวอย่างเพิ่มเติมของโมเดลการเกิดปัญหาซ้ำได้ในตารางด้านล่าง
สถานการณ์ | ข้อมูลอินพุตที่เป็นไปได้ | การคาดคะเนตัวเลข |
---|---|---|
ราคาบ้านในอนาคต | ขนาดพื้นที่ตารางฟุต รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดที่ดิน อัตราดอกเบี้ยสินเชื่อ อัตราภาษีอสังหาริมทรัพย์ ต้นทุนการก่อสร้าง และ จำนวนบ้านที่ประกาศขายในพื้นที่นี้ | ราคาของบ้าน |
ระยะเวลาเดินทางในอนาคต | สภาพการจราจรที่ผ่านมา (รวบรวมข้อมูลจากสมาร์ทโฟน การจราจร เซ็นเซอร์ บริการเรียกรถโดยสาร และแอปพลิเคชันการนำทางอื่นๆ) ระยะทางจาก และสภาพอากาศ | เวลาในหน่วยนาทีและวินาทีที่ไปถึงจุดหมาย |
การจัดประเภท
คาดการณ์โมเดลการจัดประเภท ความเป็นไปได้ที่บางสิ่งจะอยู่ในหมวดหมู่หนึ่ง ต่างจากโมเดลการถดถอย ซึ่งเอาต์พุตเป็นตัวเลข โมเดลการจัดประเภทจะแสดงค่าที่ระบุว่า ไม่ว่าเนื้อหาจะอยู่ในหมวดใดหมวดหมู่หนึ่งหรือไม่ ตัวอย่างเช่น มีการใช้โมเดลการจำแนกประเภทเพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือรูปภาพ มีแมว
โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารี และ
การแยกประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงค่าจาก
ที่มีเพียง 2 ค่าเท่านั้น เช่น โมเดลที่แสดงผล
rain
หรือ no rain
โมเดลการจัดประเภทแบบหลายคลาสจะแสดงค่าจาก
ที่มีค่ามากกว่า 2 ค่า เช่น โมเดลที่ส่งเอาต์พุต
rain
, hail
, snow
หรือ sleet
ตรวจสอบความเข้าใจ
การเรียนรู้แบบไม่มีการควบคุมดูแล
การเรียนรู้แบบไม่มีการควบคุมดูแล โมเดลจะทำการคาดการณ์โดยใช้ข้อมูลที่มีข้อมูลที่ไม่ถูกต้อง คำตอบ เป้าหมายของโมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลคือการระบุที่มีความหมาย รูปแบบต่างๆ ของข้อมูล กล่าวอีกนัยหนึ่ง โมเดลนี้ไม่มีคำแนะนำเกี่ยวกับวิธี จัดหมวดหมู่ข้อมูลแต่ละส่วน แต่ต้องสรุปกฎของตนเองแทน
โมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลที่ใช้กันโดยทั่วไปใช้เทคนิคที่เรียกว่า clustering โมเดลค้นหาจุดข้อมูล ที่จะแบ่งการจัดกลุ่มตามธรรมชาติ
รูปที่ 1 โมเดล ML จัดกลุ่มจุดข้อมูลที่คล้ายกัน
รูปที่ 2 กลุ่มคลัสเตอร์ที่มีการแบ่งส่วนตามธรรมชาติ
การจัดกลุ่มแตกต่างจากการจำแนกประเภทเนื่องจากหมวดหมู่ไม่ได้ถูกกำหนดตาม ให้ทำงานแทนคุณ ตัวอย่างเช่น โมเดลที่ไม่มีการควบคุมดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศโดยอิงตาม ซึ่งแสดงให้เห็นถึงการแบ่งกลุ่มที่กำหนดฤดูกาล จากนั้นคุณอาจ ให้พยายามตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจเกี่ยวกับชุดข้อมูล
รูปที่ 3 โมเดล ML จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน
รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่มีป้ายกำกับว่าหิมะ แผ่นน้ำแข็ง มีฝนตกและไม่ฝนตก
ตรวจสอบความเข้าใจ
การเรียนรู้แบบเสริมกำลัง
การเรียนรู้แบบเสริมกำลัง โมเดลจะทำการคาดการณ์โดยได้รับรางวัล หรือบทลงโทษที่มาจากการดำเนินการในสภาพแวดล้อมหนึ่งๆ ส่วนเสริม ระบบการเรียนรู้จะสร้างนโยบายที่ จะกำหนดกลยุทธ์ที่ดีที่สุดเพื่อให้ได้รับรางวัลมากที่สุด
การเรียนรู้แบบเสริมกำลังใช้เพื่อฝึกให้หุ่นยนต์ทำงานต่างๆ เช่น การเดิน รอบห้องและโปรแกรมซอฟต์แวร์อย่างเช่น AlphaGo เล่นเกม Go
Generative AI
Generative AI เป็นโมเดลประเภทหนึ่ง ที่สร้างเนื้อหาจากข้อมูลจากผู้ใช้ เช่น Generative AI สามารถสร้าง ภาพที่ไม่ซ้ำใคร บทประพันธ์เพลง และมุกตลก สามารถสรุปบทความ อธิบายวิธีการทำงานหรือแก้ไขรูปภาพ
Generative AI สามารถรับอินพุตที่หลากหลายและสร้างเอาต์พุตที่หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ นอกจากนี้ยังสามารถนำ และสร้างการผสมผสานระหว่าง เหล่านี้ ตัวอย่างเช่น โมเดลสามารถถ่ายภาพเป็นอินพุตและสร้างรูปภาพและ ข้อความเป็นเอาต์พุต หรือถ่ายภาพและข้อความเป็นอินพุต แล้วสร้างวิดีโอเป็นเอาต์พุต
เราสามารถพูดถึงโมเดล Generative จากข้อมูลและเอาต์พุตของโมเดล Generative AI ซึ่งมักเขียนขึ้นมา เป็น "ประเภทอินพุต" เป็น "ประเภทเอาต์พุต" ตัวอย่างต่อไปนี้เป็นส่วนหนึ่งของ รายการอินพุตและเอาต์พุตบางส่วนสำหรับโมเดล Generative:
- แปลงข้อความเป็นข้อความ
- ข้อความเป็นรูปภาพ
- การแปลงข้อความเป็นวิดีโอ
- แปลงข้อความเป็นโค้ด
- การอ่านออกเสียงข้อความ
- รูปภาพและข้อความเป็นรูปภาพ
ตารางต่อไปนี้แสดงตัวอย่างโมเดล Generative, อินพุต และ ตัวอย่างเอาต์พุตที่เป็นไปได้
รุ่น | อินพุต | ตัวอย่างเอาต์พุต |
---|---|---|
แปลงข้อความเป็นข้อความ | ใครเป็นผู้คิดค้นการแข่งขัน Le Mans |
24 Hours of Le Mans ก่อตั้งโดย Automobile Club de l'Ouest
(ACO) องค์กรยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้น
ในวันที่ 26 และ 27 พฤษภาคม 1923 ที่เส้นทาง Sarthe Circuit ระยะทาง 13.426 กิโลเมตร
วงจรถนน (8.345 ไมล์) ใกล้กับเมืองเลอมองส์ในฝรั่งเศส
แนวคิดเดิมของการแข่งขันเป็นวิธีในการส่งเสริม ACO และ
ภูมิภาคซาร์ต แหล่งที่มา: Bard |
ข้อความเป็นรูปภาพ | ปลาหมึกยักษ์ลอยอยู่ในพอร์ทัลที่กำลังอ่านหนังสือพิมพ์ |
แหล่งที่มา: Imagen |
การแปลงข้อความเป็นวิดีโอ | ตุ๊กตาหมีสมจริงในมหาสมุทรที่ซานฟรานซิสโก ตุ๊กตาหมีอยู่ใต้น้ำ หมีเท็ดดี้กำลังว่ายน้ำ ผืนน้ำที่มีปลาสีสันสดใส หมีแพนด้ากำลังว่ายน้ำ |
แหล่งที่มา: Phenaki |
แปลงข้อความเป็นโค้ด | เขียนลูป Python ที่วนซ้ำรายการตัวเลขแล้วพิมพ์จำนวนเฉพาะ |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) แหล่งที่มา: Bard |
การแปลงรูปภาพเป็นข้อความ |
นี่คือนกฟลามิงโก โดยพบในทะเลแคริบเบียน ที่มา: DeepMind ของ Google |
Generative AI ทำงานอย่างไร ในระดับสูง โมเดล Generative จะเรียนรู้ รูปแบบในข้อมูลโดยมีเป้าหมายในการสร้างข้อมูลใหม่ที่คล้ายกัน สร้างขึ้น โมเดลมีลักษณะดังต่อไปนี้
- นักแสดงตลกที่เรียนรู้ที่จะเลียนแบบผู้อื่นโดยการสังเกตพฤติกรรมของผู้คน สไตล์การพูด
- ศิลปินที่เรียนวาดภาพในสไตล์ที่เจาะจงจากการศึกษาเกี่ยวกับ ภาพวาดในรูปแบบนั้น
- วงคัฟเวอร์ที่เรียนรู้ที่จะออกเสียงให้เหมือนกลุ่มเพลงที่เจาะจงด้วยการฟัง เพลงจำนวนมากของกลุ่มนั้น
โมเดล Generative ได้รับการฝึกเบื้องต้น เพื่อสร้างเอาต์พุตที่ไม่เหมือนใครและสร้างสรรค์ โดยใช้วิธีการที่ไม่มีการควบคุมดูแล โดยโมเดลจะเรียนรู้การเลียนแบบข้อมูล ที่ได้รับการฝึกมา บางครั้งโมเดลจะได้รับการฝึกเพิ่มเติมโดยใช้การควบคุมดูแลหรือ การสนับสนุนการเรียนรู้ข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่โมเดลอาจ ขอให้ดำเนินการ เช่น สรุปบทความหรือแก้ไขรูปภาพ
Generative AI เป็นเทคโนโลยีที่พัฒนาอย่างรวดเร็วโดยมีกรณีการใช้งานใหม่ๆ อย่างต่อเนื่อง ให้ค้นพบได้ ตัวอย่างเช่น โมเดล Generative ช่วยให้ธุรกิจต่างๆ ปรับแต่ง รูปภาพผลิตภัณฑ์อีคอมเมิร์ซของตนด้วยการนำพื้นหลังที่รบกวนสายตาออกโดยอัตโนมัติ หรือการปรับปรุงคุณภาพของภาพที่มีความละเอียดต่ำ