แมชชีนเลิร์นนิงคืออะไร

แมชชีนเลิร์นนิง (ML) ขับเคลื่อนเทคโนโลยีที่สำคัญที่สุดส่วนหนึ่งที่เราใช้ ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะอัตโนมัติ หลักสูตรนี้จะอธิบายแนวคิดหลัก ที่อยู่เบื้องหลัง ML

ML นำเสนอวิธีใหม่ในการแก้ปัญหา ตอบคำถามที่ซับซ้อน และสร้างเนื้อหาใหม่ ML สามารถคาดการณ์สภาพอากาศ ประมาณเวลาเดินทาง แนะนำเพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้างรูปภาพที่ไม่เคยเห็นมาก่อน

พูดง่ายๆ ก็คือ ML เป็นกระบวนการการฝึกซอฟต์แวร์ที่เรียกว่าmodelเพื่อสร้างการคาดการณ์ที่มีประโยชน์หรือสร้างเนื้อหาจากข้อมูล

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปคาดการณ์ปริมาณฝน โดยเราจะใช้แนวทางดั้งเดิมหรือแนวทาง ML ก็ได้ เราจะใช้วิธีการแบบเดิมๆ ในการสร้างการนำเสนอภาพชั้นบรรยากาศและพื้นผิวของโลกโดยใช้หลักฟิสิกส์ และคำนวณสมการไดนามิกของของเหลวจำนวนมหาศาล เรื่องนี้ยากเหลือเชื่อ

เมื่อใช้วิธีการ ML เราจะให้โมเดลข้อมูลสภาพอากาศจำนวนมหาศาลแก่โมเดล ML จนกว่าโมเดล ML จะเรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่างรูปแบบสภาพอากาศที่ทำให้เกิดปริมาณน้ำฝนที่แตกต่างกัน จากนั้น เราจะให้ ข้อมูลสภาพอากาศปัจจุบันแก่โมเดล และคาดการณ์ปริมาณฝน

ทดสอบความเข้าใจ

"โมเดล" ในแมชชีนเลิร์นนิงคืออะไร
โมเดลคือความสัมพันธ์ทางคณิตศาสตร์ที่ได้จากข้อมูลที่ระบบ ML ใช้ในการคาดการณ์
โมเดลคือชิ้นส่วนของฮาร์ดแวร์คอมพิวเตอร์
โมเดลคือสิ่งแทนสิ่งที่คุณกำลังศึกษาขนาดเล็กกว่า

ประเภทระบบ ML

ระบบ ML จะจัดอยู่ในหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ตามวิธีการเรียนรู้วิธีการคาดการณ์หรือสร้างเนื้อหา

  • การเรียนรู้ที่มีการควบคุมดูแล
  • การเรียนรู้แบบไม่มีการควบคุมดูแล
  • การเรียนรู้แบบเสริมกำลัง
  • Generative AI

การเรียนรู้ที่มีการควบคุมดูแล

โมเดลการเรียนรู้ที่มีการควบคุมดูแลสามารถคาดการณ์ได้หลังจากเห็นข้อมูลจำนวนมากที่มีคำตอบที่ถูกต้อง และค้นพบความเชื่อมโยงระหว่างองค์ประกอบในข้อมูลที่สร้างคำตอบที่ถูกต้องได้ เปรียบได้กับนักเรียนที่ได้เรียนรู้สื่อการเรียนการสอนใหม่ๆ โดย ศึกษาข้อสอบเก่าซึ่งมีทั้งคำถามและคำตอบ เมื่อนักศึกษาได้ฝึกทำข้อสอบเก่าเพียงพอแล้ว นักเรียนก็พร้อมที่จะทำการสอบใหม่ ระบบ ML เหล่านี้มีการ "มีการควบคุมดูแล" ในลักษณะที่มนุษย์ให้ข้อมูลระบบ ML ด้วยผลลัพธ์ที่ถูกต้องซึ่งเป็นที่ทราบ

กรณีการใช้งานที่พบบ่อยที่สุด 2 กรณีสำหรับการเรียนรู้ภายใต้การควบคุมดูแลคือการถดถอยและการแยกประเภท

การถดถอย

โมเดลการถดถอยจะคาดการณ์ค่าตัวเลข เช่น โมเดลสภาพอากาศที่คาดคะเนปริมาณน้ำฝนเป็นหน่วยนิ้วหรือมิลลิเมตรก็เป็นโมเดลการถดถอย

ดูตัวอย่างเพิ่มเติมของโมเดลการถดถอยได้ในตารางด้านล่าง

สถานการณ์ ข้อมูลที่เป็นไปได้ การคาดการณ์ด้วยตัวเลข
ราคาบ้านในอนาคต พื้นที่สี่เหลี่ยมจัตุรัส รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดพื้นที่ อัตราดอกเบี้ยสินเชื่อ อัตราภาษีอสังหาริมทรัพย์ ค่าก่อสร้าง และจำนวนบ้านสำหรับขายในพื้นที่ ราคาบ้าน
เวลาโดยสารในอนาคต สภาพการจราจรที่ผ่านมา (รวบรวมจากสมาร์ทโฟน เซ็นเซอร์ตรวจจับการจราจร บริการเรียกรถ และแอปพลิเคชันการนำทางอื่นๆ) ระยะทางจากจุดหมาย และสภาพอากาศ เวลาในหน่วยนาทีและวินาทีในการเดินทางถึงจุดหมาย

การจำแนกประเภท

โมเดลการจัดประเภทจะคาดการณ์ แนวโน้มที่รายการหนึ่งๆ จะอยู่ในหมวดหมู่ โมเดลการแยกประเภทจะแสดงค่าที่ระบุว่าเนื้อหาใดอยู่ในหมวดหมู่หนึ่งๆ หรือไม่ ซึ่งแตกต่างจากโมเดลการถดถอย ตัวอย่างเช่น โมเดลการจัดประเภทใช้เพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือรูปภาพมีแมวหรือไม่

โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารีและการจัดประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงค่าจากคลาสที่มีเพียง 2 ค่า เช่น โมเดลที่มีเอาต์พุตเป็น rain หรือ no rain โมเดลการจัดประเภทแบบหลายคลาสจะแสดงค่าจากคลาสที่มีมากกว่า 2 ค่า เช่น โมเดลที่เอาต์พุตเป็น rain, hail, snow หรือ sleet ได้

ทดสอบความเข้าใจ

หากต้องการใช้โมเดล ML เพื่อคาดการณ์การใช้พลังงานสำหรับอาคารพาณิชย์ คุณจะใช้โมเดลประเภทใด
การถดถอย
การใช้พลังงานจะวัดเป็นกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงควรใช้โมเดลการถดถอย
การจำแนกประเภท
โมเดลการจัดประเภทจะคาดการณ์ว่ารายการหนึ่งๆ อยู่ในหมวดหมู่หรือไม่ ขณะที่โมเดลการถดถอยจะคาดการณ์จำนวน เนื่องจากการใช้พลังงานจะวัดเป็นกิโลวัตต์-ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงควรใช้โมเดลการถดถอย

การเรียนรู้แบบไม่มีการควบคุมดูแล

โมเดลการเรียนรู้แบบไม่มีการควบคุมดูแลทำการคาดคะเนโดยได้รับข้อมูลที่ไม่มีคำตอบที่ถูกต้อง เป้าหมายของโมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลคือการระบุรูปแบบที่มีความหมายระหว่างข้อมูล กล่าวคือ โมเดลไม่มีคำแนะนำเกี่ยวกับวิธีจัดหมวดหมู่ข้อมูลแต่ละส่วน แต่ต้องอนุมานกฎของตัวเองแทน

โมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลซึ่งใช้กันโดยทั่วไปจะใช้เทคนิคที่เรียกว่าคลัสเตอร์ โมเดลจะค้นหาจุดข้อมูล ที่แบ่งย่อยการจัดกลุ่มอย่างเป็นธรรมชาติ

รูปภาพแสดงจุดสีในกลุ่ม

รูปที่ 1 โมเดล ML คลัสเตอร์จุดข้อมูลที่คล้ายกัน

รูปภาพแสดงจุดสีในกลุ่มที่อยู่ในรูปร่างและมีเส้นขอบซึ่งกันและกัน

รูปที่ 2 กลุ่มของกลุ่มที่มีการแบ่งแยกทางธรรมชาติ

การจัดกลุ่มแตกต่างจากการจัดประเภทเนื่องจากคุณไม่ได้เป็นผู้กำหนดหมวดหมู่ เช่น โมเดลที่ไม่มีการควบคุมดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศตามอุณหภูมิ ซึ่งจะแสดงการแบ่งกลุ่มที่กำหนดฤดูกาล จากนั้นคุณอาจลองตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจเกี่ยวกับชุดข้อมูล

รูปภาพแสดงจุดสีในกลุ่มที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน

รูปที่ 3 โมเดล ML จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน

รูปภาพแสดงจุดสีในกลุ่มที่มีป้ายกำกับเป็นหิมะ ฝน ลูกเห็บ และฝนที่ไม่มีฝนล้อมอยู่ในรูปร่างและมีเส้นขอบซึ่งกันและกัน

รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่มีป้ายกำกับว่าหิมะ ลูกเห็บ ฝน และไม่มีฝน

ทดสอบความเข้าใจ

วิธีการที่มีการควบคุมดูแลแตกต่างจากวิธีการที่ไม่มีการควบคุมดูแลอย่างไร
วิธีการภายใต้การควบคุมดูแลจะให้ข้อมูลที่มีคำตอบที่ถูกต้อง
วิธีการภายใต้การควบคุมดูแลจะให้ข้อมูลที่มีคำตอบที่ถูกต้อง งานของโมเดลคือการค้นหาการเชื่อมต่อในข้อมูลที่ให้คำตอบที่ถูกต้อง วิธีการที่ไม่มีการควบคุมดูแลจะได้รับข้อมูลโดยไม่มีคำตอบที่ถูกต้อง แต่มีหน้าที่ในการค้นหาการจัดกลุ่มในข้อมูล
โดยทั่วไปวิธีที่มีการควบคุมดูแลจะใช้การจัดกลุ่ม
วิธีการที่ไม่มีการควบคุมดูแลใช้การจัดกลุ่ม
วิธีการที่ไม่มีการควบคุมดูแลจะรู้วิธีติดป้ายกำกับคลัสเตอร์ข้อมูล
วิธีการที่ไม่มีการควบคุมดูแลจะไม่ทราบถึงความหมายของคลัสเตอร์ข้อมูล คุณเป็นผู้กำหนดข้อมูลดังกล่าวเองตามความเข้าใจที่คุณมีต่อข้อมูล

การเรียนรู้แบบเสริมกำลัง

โมเดลการเรียนรู้แบบเสริมกำลังสร้างการคาดการณ์ด้วยการได้รับรางวัลหรือบทลงโทษตามการดำเนินการที่เกิดขึ้นภายในสภาพแวดล้อม ระบบการเรียนรู้แบบเสริมกำลังจะสร้างนโยบายที่กำหนดกลยุทธ์ที่ดีที่สุดเพื่อให้ได้รับรางวัลมากที่สุด

การเรียนรู้แบบเสริมแรงใช้ฝึกหุ่นยนต์ให้ทํางานต่างๆ เช่น การเดินรอบห้อง และโปรแกรมซอฟต์แวร์อย่าง AlphaGo เพื่อเล่นเกม Go

Generative AI

Generative AI เป็นโมเดลประเภทหนึ่งที่สร้างเนื้อหาจากข้อมูลที่ผู้ใช้ป้อน ตัวอย่างเช่น Generative AI สามารถสร้างรูปภาพ การเรียบเรียงเพลง และมุกตลกที่ไม่ซ้ำใคร ทั้งยังสรุปบทความ อธิบายวิธีการทำงาน หรือแก้ไขรูปภาพได้ด้วย

Generative AI สามารถใช้อินพุตที่หลากหลายและสร้างเอาต์พุตที่หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ รวมถึงนำค่าเหล่านี้มาสร้าง และผสมผสานรูปแบบต่างๆ ได้ ตัวอย่างเช่น โมเดลสามารถนำรูปภาพเป็นอินพุตและสร้างรูปภาพและข้อความเป็นเอาต์พุต หรือถ่ายภาพและข้อความเป็นอินพุตและสร้างวิดีโอเป็นเอาต์พุต

เราสามารถพูดคุยถึงโมเดล Generative จากอินพุตและเอาต์พุต ซึ่งโดยปกติแล้วจะเขียนเป็น "ประเภทอินพุต" ถึง "ประเภทเอาต์พุต" ตัวอย่างต่อไปนี้เป็นอินพุตและเอาต์พุตบางส่วนสำหรับโมเดล Generative

  • แปลงข้อความเป็นข้อความ
  • การแปลงข้อความเป็นรูปภาพ
  • การแปลงข้อความเป็นวิดีโอ
  • การแปลงข้อความเป็นโค้ด
  • การอ่านออกเสียงข้อความ
  • รูปภาพและข้อความเป็นรูปภาพ

ตารางต่อไปนี้แสดงรายการตัวอย่างโมเดล Generative, อินพุต และตัวอย่างเอาต์พุตที่เป็นไปได้

รุ่น อินพุต ตัวอย่างเอาต์พุต
แปลงข้อความเป็นข้อความ ใครคิดค้นเชื้อชาติเลอมองส์ 24 Hours of Le Mans ก่อตั้งโดย Automobile Club de l'Ouest (ACO) ซึ่งเป็นองค์กรยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้นเมื่อวันที่ 26 และ 27 พฤษภาคม 1923 บนสนามแข่งรถ Sarthe Circuit ระยะทาง 13.426 กิโลเมตร (8.345 ไมล์) ตั้งอยู่ใกล้กับเมืองเลอมองส์ในฝรั่งเศส เดิมทีเชื้อชาตินี้เป็นช่องทางในการโปรโมต ACO และภูมิภาคซาร์เธ
แหล่งที่มา: Bard
การแปลงข้อความเป็นรูปภาพ มนุษย์ต่างดาวลอยผ่านประตูทางเข้าอ่านหนังสือพิมพ์ รูปภาพของการ์ตูนหมึกยักษ์
แหล่งที่มา: Imagen
การแปลงข้อความเป็นวิดีโอ ตุ๊กตาหมีสมจริงกำลังว่ายน้ำในมหาสมุทรที่ซานฟรานซิสโก หมีเท็ดดี้จมน้ำ ตุ๊กตาหมีว่ายใต้น้ำพร้อมกับปลาหลากสีสัน หมีแพนด้ากำลังว่ายน้ำ วิดีโอหมีเท็ดดี้ว่ายน้ำใต้น้ำ
แหล่งที่มา: Phenaki
การแปลงข้อความเป็นโค้ด เขียนลูป Python ที่วนรอบรายการตัวเลขและพิมพ์ตัวเลขเฉพาะ
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

แหล่งที่มา: Bard
รูปภาพเป็นข้อความ รูปภาพนกฟลามิงโก นี่คือนกฟลามิงโก พบได้ในทะเลแคริบเบียน
แหล่งที่มา: Google DeepMind

Generative AI ทำงานอย่างไร ในระดับสูง โมเดล Generative จะเรียนรู้รูปแบบในข้อมูลโดยมีเป้าหมายเพื่อสร้างข้อมูลใหม่แต่มีความคล้ายคลึงกัน โมเดล Generative มีลักษณะดังนี้

  • นักเล่าเรื่องขำขันที่เรียนรู้วิธีเลียนแบบผู้อื่นโดยสังเกตพฤติกรรม และรูปแบบการพูดของผู้คน
  • ศิลปินที่เรียนรู้การวาดภาพสไตล์หนึ่งๆ โดยศึกษาภาพวาดจำนวนมาก ในรูปแบบนั้น
  • วงคัฟเวอร์ที่เรียนรู้ที่จะร้องเพลงให้เหมือนวงดนตรีเฉพาะ ด้วยการฟังเพลงหลายๆ เพลงของกลุ่มนั้น

ในการสร้างเอาต์พุตที่สร้างสรรค์และไม่ซ้ำใคร โมเดล Generative จะได้รับการฝึกเบื้องต้นโดยใช้วิธีการที่ไม่มีการควบคุมดูแล ซึ่งโมเดลจะเรียนรู้ที่จะเลียนแบบข้อมูลที่ฝึก บางครั้งโมเดลจะได้รับการฝึกเพิ่มเติมโดยใช้การเรียนรู้ที่มีการควบคุมดูแลหรือการเสริมประสิทธิภาพในข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่ระบบอาจขอให้โมเดลดำเนินการ เช่น สรุปบทความหรือแก้ไขรูปภาพ

Generative AI เป็นเทคโนโลยีที่พัฒนาไปอย่างรวดเร็วโดยมี Use Case ใหม่ๆ ที่เราค้นพบอย่างต่อเนื่อง ตัวอย่างเช่น โมเดล Generative ช่วยให้ธุรกิจปรับแต่งรูปภาพผลิตภัณฑ์อีคอมเมิร์ซของตนโดยการนำพื้นหลังที่รบกวนสายตาออกโดยอัตโนมัติหรือปรับปรุงคุณภาพของรูปภาพที่มีความละเอียดต่ำ