แมชชีนเลิร์นนิงคืออะไร

แมชชีนเลิร์นนิง (ML) เป็นเทคโนโลยีสําคัญที่สุดอย่างหนึ่งที่เราใช้ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะไร้คนขับ หลักสูตรนี้จะอธิบายแนวคิดหลักที่อยู่เบื้องหลัง ML

ML เป็นวิธีใหม่ในการแก้ปัญหา ตอบคําถามที่ซับซ้อน และสร้างเนื้อหาใหม่ ML สามารถคาดการณ์สภาพอากาศ ประมาณเวลาเดินทาง แนะนำเพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้างรูปภาพที่ไม่เคยเห็นมาก่อน

พูดง่ายๆ ก็คือ ML คือกระบวนการฝึกซอฟต์แวร์ที่เรียกว่าโมเดลเพื่อทำการคาดการณ์ที่เป็นประโยชน์หรือสร้างเนื้อหาจากข้อมูล

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปพยากรณ์ฝน เราอาจใช้แนวทางแบบดั้งเดิมหรือแนวทาง ML ก็ได้ เมื่อใช้แนวทางแบบดั้งเดิม เราจะสร้างการนำเสนอบรรยากาศและพื้นผิวของโลกตามหลักการทางฟิสิกส์ โดยคำนวณสมการของพลศาสตร์ของไหลจํานวนมหาศาล ซึ่งเป็นเรื่องที่ยากมาก

เมื่อใช้แนวทาง ML เราจะให้ข้อมูลสภาพอากาศจํานวนมหาศาลแก่โมเดล ML จนกว่าโมเดล ML จะเรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่างรูปแบบสภาพอากาศที่ทำให้เกิดปริมาณฝนที่แตกต่างกัน จากนั้นเราจะป้อนข้อมูลสภาพอากาศปัจจุบันให้กับโมเดล แล้วโมเดลจะคาดการณ์ปริมาณฝน

ทดสอบความเข้าใจ

"โมเดล" ในแมชชีนเลิร์นนิงคืออะไร
โมเดลคือความสัมพันธ์ทางคณิตศาสตร์ที่มาจากข้อมูลที่ระบบ ML ใช้ทําการคาดการณ์
รุ่นคือชิ้นส่วนฮาร์ดแวร์คอมพิวเตอร์
โมเดลคือสิ่งที่แสดงถึงสิ่งที่คุณศึกษาในขนาดที่เล็กลง

ประเภทของระบบ ML

ระบบ ML แบ่งออกเป็นหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ตามวิธีที่ระบบเรียนรู้เพื่อทำนายหรือสร้างเนื้อหา

  • การเรียนรู้ที่มีการควบคุมดูแล
  • การเรียนรู้ที่ไม่มีการควบคุมดูแล
  • การเรียนรู้แบบเสริมกำลัง
  • Generative AI

การเรียนรู้ที่มีการควบคุมดูแล

โมเดลการเรียนรู้ที่มีการควบคุมดูแลสามารถคาดการณ์ได้หลังจากเห็นข้อมูลจํานวนมากที่มีคําตอบที่ถูกต้อง แล้วค้นพบความสัมพันธ์ระหว่างองค์ประกอบในข้อมูลที่ให้คําตอบที่ถูกต้อง การดำเนินการนี้เหมือนกับนักเรียนเรียนรู้เนื้อหาใหม่โดยการศึกษาข้อสอบเก่าซึ่งมีทั้งคำถามและคำตอบ เมื่อนักเรียนฝึกทำข้อสอบเก่าๆ มากพอแล้ว นักเรียนก็พร้อมที่จะทำข้อสอบใหม่ ระบบ ML เหล่านี้เป็นระบบ "ที่มีการควบคุมดูแล" ในแง่ที่มนุษย์ให้ข้อมูลกับระบบ ML โดยมีผลลัพธ์ที่ถูกต้องซึ่งทราบอยู่แล้ว

กรณีการใช้งานที่พบบ่อยที่สุด 2 รายการสําหรับการเรียนรู้แบบควบคุมคือ การหาค่าสัมประสิทธิ์การถดถอยและการแยกประเภท

การถดถอย

โมเดลการถดถอยจะคาดการณ์ค่าตัวเลข เช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณน้ำฝนเป็นนิ้วหรือมิลลิเมตรคือโมเดลการถดถอย

ดูตัวอย่างเพิ่มเติมของโมเดลการถดถอยได้ในตารางด้านล่าง

สถานการณ์ ข้อมูลอินพุตที่เป็นไปได้ การคาดคะเนตัวเลข
ราคาบ้านในอนาคต พื้นที่ใช้สอย รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดแปลงที่ดิน อัตราดอกเบี้ยสินเชื่อ อัตราภาษีอสังหาริมทรัพย์ ค่าใช้จ่ายในการก่อสร้าง และจำนวนบ้านที่ขายในบริเวณนั้น ราคาบ้าน
เวลาเรียกรถในอนาคต สภาพการจราจรที่ผ่านมา (รวบรวมจากสมาร์ทโฟน เซ็นเซอร์การจราจร แอปพลิเคชันเรียกรถและการนำทางอื่นๆ) ระยะทางจากจุดหมาย และสภาพอากาศ เวลาเป็นนาทีและวินาทีที่ใช้ในการไปถึงจุดหมาย

การจัดประเภท

โมเดลการจัดประเภทจะคาดการณ์ความเป็นไปได้ที่สิ่งหนึ่งๆ จะอยู่ในหมวดหมู่ ซึ่งแตกต่างจากโมเดลการถดถอยที่เอาต์พุตเป็นตัวเลข โมเดลการจัดประเภทจะแสดงผลค่าที่ระบุว่ารายการหนึ่งๆ อยู่ในหมวดหมู่หนึ่งๆ หรือไม่ เช่น ระบบจะใช้โมเดลการจัดประเภทเพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือไม่ หรือรูปภาพมีแมวหรือไม่

โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารีและการจัดประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงผลค่าจากคลาสที่มีเพียง 2 ค่า เช่น โมเดลที่แสดงผล rain หรือ no rain โมเดลการจัดประเภทหลายคลาสจะแสดงผลค่าจากคลาสที่มีค่ามากกว่า 2 ค่า เช่น โมเดลที่แสดงผลได้ rain, hail, snow หรือ sleet

ทดสอบความเข้าใจ

หากต้องการใช้โมเดล ML เพื่อคาดการณ์การใช้พลังงานสําหรับอาคารพาณิชย์ คุณจะใช้โมเดลประเภทใด
การถดถอย
การใช้พลังงานวัดเป็นกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงควรใช้โมเดลการถดถอย
การจัดประเภท
โมเดลการจัดประเภทจะคาดการณ์ว่าข้อมูลบางอย่างอยู่ในหมวดหมู่หรือไม่ ขณะที่โมเดลการเกิดปัญหาซ้ำจะคาดการณ์ตัวเลข เนื่องจากระบบวัดการใช้พลังงานเป็นกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงควรใช้โมเดลการถดถอย

การเรียนรู้ที่ไม่มีการควบคุมดูแล

โมเดลการเรียนรู้แบบไม่ควบคุมดูแลจะทำการคาดการณ์โดยได้รับข้อมูลที่ไม่มีคําตอบที่ถูกต้อง เป้าหมายของโมเดลการเรียนรู้แบบไม่ควบคุมดูแลคือการระบุรูปแบบที่มีความหมายในข้อมูล กล่าวคือ โมเดลไม่มีคำแนะนำเกี่ยวกับวิธีจัดหมวดหมู่ข้อมูลแต่ละรายการ แต่ต้องอนุมานกฎของตนเอง

โมเดลการเรียนรู้แบบไม่ควบคุมที่ใช้กันโดยทั่วไปจะใช้เทคนิคที่เรียกว่าการจัดกลุ่ม โมเดลจะค้นหาจุดข้อมูลที่กําหนดขอบเขตการจัดกลุ่มตามธรรมชาติ

รูปภาพที่แสดงจุดสีเป็นกลุ่ม

รูปที่ 1 โมเดล ML จัดกลุ่มจุดข้อมูลที่คล้ายกัน

รูปภาพที่แสดงจุดสีเป็นกลุ่มๆ ที่ล้อมรอบด้วยรูปร่างและอยู่ติดกัน

รูปที่ 2 กลุ่มคลัสเตอร์ที่มีขอบเขตตามธรรมชาติ

การคลัสเตอร์แตกต่างจากการจัดประเภทเนื่องจากคุณไม่ได้เป็นผู้กําหนดหมวดหมู่ เช่น โมเดลที่ไม่มีการควบคุมดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศตามอุณหภูมิ ซึ่งจะแสดงการแบ่งกลุ่มที่กําหนดฤดูกาล จากนั้นคุณอาจลองตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจของคุณเกี่ยวกับชุดข้อมูล

รูปภาพที่แสดงจุดสีเป็นกลุ่มๆ ที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน

รูปที่ 3 โมเดล ML ที่จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน

รูปภาพที่แสดงจุดสีเป็นกลุ่มๆ ที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน ซึ่งอยู่ในรูปทรงหนึ่งๆ และอยู่ติดกัน

รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่ติดป้ายกำกับว่าหิมะ น้ำแข็งผสมกับฝน ฝน และไม่ฝน

ทดสอบความเข้าใจ

แนวทางที่มีการควบคุมดูแลแตกต่างจากแนวทางที่ไม่มีการควบคุมดูแลอย่างไร
วิธีการที่มีการควบคุมจะได้รับข้อมูลที่มีคําตอบที่ถูกต้อง
วิธีการที่มีการควบคุมจะได้รับข้อมูลที่มีคําตอบที่ถูกต้อง หน้าที่ของโมเดลคือค้นหาความสัมพันธ์ในข้อมูลที่ให้คำตอบที่ถูกต้อง วิธีการที่ไม่มีการควบคุมดูแลจะได้รับข้อมูลโดยไม่มีคำตอบที่ถูกต้อง หน้าที่ของโมเดลนี้คือค้นหาการจัดกลุ่มในข้อมูล
โดยปกติแล้วแนวทางที่มีการควบคุมดูแลจะใช้การคลัสเตอร์
แนวทางแบบไม่ควบคุมใช้การคลัสเตอร์
วิธีการแบบไม่ควบคุมจะทราบวิธีติดป้ายกำกับคลัสเตอร์ของข้อมูล
วิธีการแบบไม่ควบคุมจะไม่ทราบว่าคลัสเตอร์ของข้อมูลมีความหมายอย่างไร คุณเป็นผู้กําหนดเองโดยอิงตามความเข้าใจของคุณเกี่ยวกับข้อมูล

การเรียนรู้แบบเสริมกำลัง

โมเดลการเรียนรู้เพื่อเสริมแรงจะทําการคาดการณ์โดยรับรางวัลหรือบทลงโทษตามการดําเนินการภายในสภาพแวดล้อม ระบบการเรียนรู้ด้วยการทำซ้ำจะสร้างนโยบายที่กําหนดกลยุทธ์ที่ดีที่สุดเพื่อให้ได้รับรางวัลมากที่สุด

การเรียนรู้ด้วยการทำซ้ำใช้เพื่อฝึกหุ่นยนต์ให้ทำงานต่างๆ เช่น การเดินไปรอบๆ ห้อง และโปรแกรมซอฟต์แวร์อย่าง AlphaGo เพื่อเล่นเกมโกะ

Generative AI

Generative AI คือคลาสของโมเดลที่สร้างเนื้อหาจากข้อมูลที่ผู้ใช้ป้อน เช่น Generative AI สามารถสร้างรูปภาพ การแต่งเพลง และมุกตลกที่ไม่เหมือนใคร รวมถึงสรุปบทความ อธิบายวิธีทำงาน หรือแก้ไขรูปภาพ

Generative AI สามารถใช้อินพุตที่หลากหลายเพื่อสร้างเอาต์พุตที่หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ รวมถึงสร้างชุดค่าผสมของข้อมูลเหล่านี้ได้ด้วย เช่น โมเดลอาจใช้รูปภาพเป็นอินพุตและสร้างรูปภาพและข้อความเป็นเอาต์พุต หรือใช้รูปภาพและข้อความเป็นอินพุตและสร้างวิดีโอเป็นเอาต์พุต

เราอาจพูดถึงโมเดล Generative ตามอินพุตและเอาต์พุต ซึ่งโดยทั่วไปจะเขียนเป็น "ประเภทอินพุต"-"ประเภทเอาต์พุต" ตัวอย่างเช่น รายการต่อไปนี้เป็นรายการอินพุตและเอาต์พุตบางส่วนของโมเดล Generative

  • การแปลงข้อความเป็นข้อความ
  • การเปลี่ยนข้อความเป็นรูปภาพ
  • เปลี่ยนข้อความเป็นวิดีโอ
  • การเปลี่ยนข้อความเป็นโค้ด
  • การอ่านออกเสียงข้อความ
  • รูปภาพและการเปลี่ยนข้อความเป็นรูปภาพ

ตารางต่อไปนี้แสดงตัวอย่างโมเดล Generative, อินพุตของโมเดล และตัวอย่างเอาต์พุตที่เป็นไปได้

รุ่น อินพุต ตัวอย่างเอาต์พุต
การแปลงข้อความเป็นข้อความ ใครเป็นผู้คิดค้นการแข่งขัน Le Mans การแข่งขัน 24 Hours of Le Mans ก่อตั้งโดย Automobile Club de l'Ouest (ACO) ซึ่งเป็นองค์กรยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้นในวันที่ 26 และ 27 พฤษภาคม 1923 ที่ Sarthe Circuit ซึ่งเป็นสนามแข่งบนถนนระยะทาง 13.426 กิโลเมตร (8.345 ไมล์) ที่อยู่ใกล้กับเมืองเลอ ม็องส์ในฝรั่งเศส การแข่งขันนี้เริ่มขึ้นเพื่อโปรโมต ACO และภูมิภาค Sarthe
แหล่งที่มา: Bard
การเปลี่ยนข้อความเป็นรูปภาพ ปลาหมึกต่างดาวลอยผ่านพอร์ทัลขณะอ่านหนังสือพิมพ์ รูปภาพหมึกการ์ตูน
แหล่งที่มา: Imagen
เปลี่ยนข้อความเป็นวิดีโอ ตุ๊กตาหมีที่ดูเหมือนจริงกำลังว่ายน้ำในมหาสมุทรที่ซานฟรานซิสโก หมีเท็ดดี้ลงไปใต้น้ำ ตุ๊กตาหมีว่ายน้ำใต้น้ำไปเรื่อยๆ พร้อมกับปลาหลากสี หมีแพนด้ากำลังว่ายน้ำใต้น้ำ วิดีโอหมีเท็ดดี้ว่ายน้ำใต้น้ำ
แหล่งที่มา: Phenaki
การเปลี่ยนข้อความเป็นโค้ด เขียนลูป Python ที่วนซ้ำรายการตัวเลขและพิมพ์จำนวนเฉพาะ
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

แหล่งที่มา: Bard
การแปลงรูปภาพเป็นข้อความ รูปนกฟลามิงโก นี่คือนกฟลามิงโก พบในทะเลแคริบเบียน
แหล่งที่มา: Google DeepMind

Generative AI ทำงานอย่างไร ในระดับสูง โมเดล Generative จะเรียนรู้รูปแบบในข้อมูลโดยมีเป้าหมายเพื่อสร้างข้อมูลใหม่แต่คล้ายกัน โมเดล Generative มีลักษณะดังนี้

  • นักแสดงตลกที่เรียนรู้ที่จะเลียนแบบผู้อื่นด้วยการสังเกตพฤติกรรมและรูปแบบการพูดของผู้คน
  • ศิลปินที่เรียนรู้การวาดภาพในสไตล์หนึ่งๆ โดยการศึกษาภาพวาดจำนวนมากในสไตล์นั้น
  • วงดนตรีที่คัฟเวอร์เพลงของวงอื่นโดยพยายามเลียนแบบเสียงของวงนั้นๆ ด้วยการฟังเพลงของวงนั้นๆ เป็นจำนวนมาก

โมเดล Generative ได้รับการฝึกฝนโดยใช้วิธีการแบบไม่ควบคุมดูแลตั้งแต่แรก เพื่อให้ได้เอาต์พุตที่ไม่เหมือนใครและสร้างสรรค์ โดยโมเดลจะเรียนรู้ที่จะเลียนแบบข้อมูลที่ใช้ฝึก บางครั้งระบบจะฝึกโมเดลเพิ่มเติมโดยใช้การเรียนรู้แบบควบคุมหรือการเรียนรู้ด้วยการทำซ้ำกับข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่ระบบอาจขอให้โมเดลดำเนินการ เช่น สรุปบทความหรือแก้ไขรูปภาพ

Generative AI เป็นเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็ว โดยมีกรณีการใช้งานใหม่ๆ ค้นพบอยู่เสมอ เช่น โมเดล Generative ช่วยให้ธุรกิจปรับแต่งรูปภาพผลิตภัณฑ์อีคอมเมิร์ซได้โดยอัตโนมัติด้วยการนําพื้นหลังที่รบกวนออก หรือปรับปรุงคุณภาพของรูปภาพที่มีความละเอียดต่ำ