แมชชีนเลิร์นนิงคืออะไร

แมชชีนเลิร์นนิง (ML) เป็นตัวขับเคลื่อนเทคโนโลยีที่สำคัญที่สุดที่เราใช้ ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะแบบไร้คนขับ หลักสูตรนี้จะอธิบายถึงหัวใจสำคัญ แนวคิดเบื้องหลัง ML

ML นำเสนอวิธีใหม่ในการแก้ไขปัญหา ตอบคำถามที่ซับซ้อน และสร้างสรรค์เนื้อหาใหม่ๆ เนื้อหา ML สามารถคาดการณ์สภาพอากาศ ประมาณเวลาเดินทาง แนะนำ เพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้าง รูปภาพที่ไม่เคยเห็นมาก่อน

พูดง่ายๆ ก็คือ ML เป็นกระบวนการของ การฝึกอบรมเกี่ยวกับซอฟต์แวร์ ซึ่งเรียกว่า model เพื่อให้มีประโยชน์ การคาดคะเนหรือสร้างเนื้อหาจาก

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปเพื่อคาดการณ์ปริมาณฝน เราสามารถ ใช้แนวทางแบบดั้งเดิมหรือแนวทาง ML ใช้ข้อความดั้งเดิม เราจะสร้างการนำเสนอชั้นบรรยากาศของโลกโดยอ้างอิงตามหลักฟิสิกส์ และพื้นผิว คำนวณสมการไดนามิกของไหลจำนวนมหาศาล นี่คือ ยากเหลือเชื่อ

ในการใช้แนวทาง ML เราจะให้ข้อมูลสภาพอากาศแก่โมเดล ML จำนวนมหาศาล จนกว่าโมเดล ML จะได้เรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่าง รูปแบบสภาพอากาศที่ทำให้เกิดปริมาณน้ำฝนที่แตกต่างกัน จากนั้นเราจะให้ สร้างแบบจำลองข้อมูลสภาพอากาศปัจจุบัน และคาดการณ์ปริมาณน้ำฝน

ตรวจสอบความเข้าใจ

"โมเดล" คืออะไร ในด้านแมชชีนเลิร์นนิง
โมเดลคือความสัมพันธ์ทางคณิตศาสตร์ที่ได้มาจากข้อมูลที่ ML ที่ระบบใช้เพื่อคาดการณ์
โมเดลคือชิ้นส่วนของฮาร์ดแวร์คอมพิวเตอร์
โมเดลคือสิ่งที่มีขนาดเล็กกว่าของสิ่งที่คุณกำลังศึกษา

ประเภทระบบ ML

ระบบ ML จะจัดอยู่ในหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ตามลักษณะ เรียนรู้วิธีคาดการณ์หรือสร้างเนื้อหา

  • การเรียนรู้ที่มีการควบคุมดูแล
  • การเรียนรู้แบบไม่มีการควบคุมดูแล
  • การเรียนรู้แบบเสริมกำลัง
  • Generative AI

การเรียนรู้ที่มีการควบคุมดูแล

การเรียนรู้แบบมีการควบคุมดูแล โมเดลก็สามารถคาดการณ์ได้หลังจากเห็นข้อมูลจำนวนมากพร้อมคำตอบที่ถูกต้อง จากนั้นก็ค้นพบความเชื่อมโยงระหว่างองค์ประกอบต่างๆ ในข้อมูลที่ จะให้คำตอบที่ถูกต้อง ซึ่งเหมือนกับการเรียนรู้สื่อการเรียนการสอนใหม่ของนักเรียนโดย การเรียนการสอบเก่าๆ ที่มีทั้งคำถามและคำตอบ เมื่อนักเรียนมี ได้รับการฝึกอบรมจากข้อสอบเก่าจำนวนมากพอ นักเรียนก็พร้อมจะทำข้อสอบใหม่ ระบบ ML เหล่านี้มี "การควบคุมดูแล" ในแง่ของการที่มนุษย์ทำให้ระบบ ML ซึ่งมีผลลัพธ์ที่ถูกต้องที่ทราบ

กรณีการใช้งานที่พบบ่อยที่สุด 2 กรณีสำหรับการเรียนรู้ภายใต้การควบคุมดูแลคือการถดถอยและ การจำแนกประเภท

การถดถอย

โมเดลการถดถอยคาดการณ์ ที่เป็นตัวเลข ตัวอย่างเช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณน้ำฝนใน นิ้วหรือมิลลิเมตรเป็นโมเดลการถดถอย

ดูตัวอย่างเพิ่มเติมของโมเดลการเกิดปัญหาซ้ำได้ในตารางด้านล่าง

สถานการณ์ ข้อมูลอินพุตที่เป็นไปได้ การคาดคะเนตัวเลข
ราคาบ้านในอนาคต ขนาดพื้นที่ตารางฟุต รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดที่ดิน อัตราดอกเบี้ยสินเชื่อ อัตราภาษีอสังหาริมทรัพย์ ต้นทุนการก่อสร้าง และ จำนวนบ้านที่ประกาศขายในพื้นที่นี้ ราคาของบ้าน
ระยะเวลาเดินทางในอนาคต สภาพการจราจรที่ผ่านมา (รวบรวมข้อมูลจากสมาร์ทโฟน การจราจร เซ็นเซอร์ บริการเรียกรถโดยสาร และแอปพลิเคชันการนำทางอื่นๆ) ระยะทางจาก และสภาพอากาศ เวลาในหน่วยนาทีและวินาทีที่ไปถึงจุดหมาย

การจัดประเภท

คาดการณ์โมเดลการจัดประเภท ความเป็นไปได้ที่บางสิ่งจะอยู่ในหมวดหมู่หนึ่ง ต่างจากโมเดลการถดถอย ซึ่งเอาต์พุตเป็นตัวเลข โมเดลการจัดประเภทจะแสดงค่าที่ระบุว่า ไม่ว่าเนื้อหาจะอยู่ในหมวดใดหมวดหมู่หนึ่งหรือไม่ ตัวอย่างเช่น มีการใช้โมเดลการจำแนกประเภทเพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือรูปภาพ มีแมว

โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารี และ การแยกประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงค่าจาก ที่มีเพียง 2 ค่าเท่านั้น เช่น โมเดลที่แสดงผล rain หรือ no rain โมเดลการจัดประเภทแบบหลายคลาสจะแสดงค่าจาก ที่มีค่ามากกว่า 2 ค่า เช่น โมเดลที่ส่งเอาต์พุต rain, hail, snow หรือ sleet

ตรวจสอบความเข้าใจ

หากคุณต้องการใช้โมเดล ML เพื่อคาดการณ์การใช้พลังงานในเชิงพาณิชย์ สิ่งปลูกสร้าง คุณจะใช้โมเดลประเภทใด
การถดถอย
การใช้พลังงานจะวัดเป็นหน่วยกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงต้องใช้โมเดลการถดถอย
การจัดประเภท
โมเดลการจัดประเภทจะคาดการณ์ว่าเนื้อหาใดอยู่ในหมวดหมู่หนึ่งหรือไม่ ขณะที่ โมเดลการถดถอยจะคาดการณ์จำนวน เนื่องจากการใช้พลังงานจะวัดเป็นหน่วย กิโลวัตต์-ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณควรใช้โมเดลการถดถอย

การเรียนรู้แบบไม่มีการควบคุมดูแล

การเรียนรู้แบบไม่มีการควบคุมดูแล โมเดลจะทำการคาดการณ์โดยใช้ข้อมูลที่มีข้อมูลที่ไม่ถูกต้อง คำตอบ เป้าหมายของโมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลคือการระบุที่มีความหมาย รูปแบบต่างๆ ของข้อมูล กล่าวอีกนัยหนึ่ง โมเดลนี้ไม่มีคำแนะนำเกี่ยวกับวิธี จัดหมวดหมู่ข้อมูลแต่ละส่วน แต่ต้องสรุปกฎของตนเองแทน

โมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลที่ใช้กันโดยทั่วไปใช้เทคนิคที่เรียกว่า clustering โมเดลค้นหาจุดข้อมูล ที่จะแบ่งการจัดกลุ่มตามธรรมชาติ

รูปภาพแสดงจุดสีในกลุ่ม

รูปที่ 1 โมเดล ML จัดกลุ่มจุดข้อมูลที่คล้ายกัน

รูปภาพแสดงจุดสีในกลุ่มที่อยู่ในรูปร่างและมีเส้นขอบซึ่งกันและกัน

รูปที่ 2 กลุ่มคลัสเตอร์ที่มีการแบ่งส่วนตามธรรมชาติ

การจัดกลุ่มแตกต่างจากการจำแนกประเภทเนื่องจากหมวดหมู่ไม่ได้ถูกกำหนดตาม ให้ทำงานแทนคุณ ตัวอย่างเช่น โมเดลที่ไม่มีการควบคุมดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศโดยอิงตาม ซึ่งแสดงให้เห็นถึงการแบ่งกลุ่มที่กำหนดฤดูกาล จากนั้นคุณอาจ ให้พยายามตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจเกี่ยวกับชุดข้อมูล

รูปภาพแสดงจุดสีในกลุ่มที่มีป้ายกำกับเป็นหิมะ ฝน ลูกเห็บ และไม่ฝนตก

รูปที่ 3 โมเดล ML จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน

รูปภาพแสดงจุดสีในกลุ่มที่มีป้ายกำกับเป็นหิมะ ฝน ลูกเห็บ และไม่มีฝน ล้อมรอบเป็นรูปร่างและมีเส้นขอบกัน

รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่มีป้ายกำกับว่าหิมะ แผ่นน้ำแข็ง มีฝนตกและไม่ฝนตก

ตรวจสอบความเข้าใจ

อะไรทำให้วิธีการที่มีการควบคุมดูแลแตกต่างจากวิธีการที่ไม่มีการควบคุมดูแล
แนวทางภายใต้การควบคุมดูแลคือข้อมูลที่มีคำตอบที่ถูกต้อง
แนวทางภายใต้การควบคุมดูแลคือข้อมูลที่มีคำตอบที่ถูกต้อง หน้าที่ของโมเดลคือการค้นหาการเชื่อมต่อในข้อมูลที่ทำให้เกิดการแสดงผล คำตอบ วิธีการที่ไม่มีการควบคุมดูแลมาจากข้อมูลที่ไม่มีคำตอบที่ถูกต้อง หน้าที่ของมัน คือการค้นหาการจัดกลุ่มในข้อมูล
โดยทั่วไปแนวทางที่มีการควบคุมดูแลจะใช้การจัดกลุ่ม
วิธีการที่ไม่มีการควบคุมดูแลใช้การจัดกลุ่ม
วิธีการที่ไม่มีการควบคุมดูแลรู้วิธีติดป้ายกำกับคลัสเตอร์ข้อมูล
แนวทางที่ไม่มีการควบคุมดูแลจะไม่รู้ว่าคลัสเตอร์ข้อมูลหมายถึงอะไร จากความเข้าใจที่คุณมีต่อข้อมูล คุณสามารถเป็นผู้กำหนดคำจำกัดความได้

การเรียนรู้แบบเสริมกำลัง

การเรียนรู้แบบเสริมกำลัง โมเดลจะทำการคาดการณ์โดยได้รับรางวัล หรือบทลงโทษที่มาจากการดำเนินการในสภาพแวดล้อมหนึ่งๆ ส่วนเสริม ระบบการเรียนรู้จะสร้างนโยบายที่ จะกำหนดกลยุทธ์ที่ดีที่สุดเพื่อให้ได้รับรางวัลมากที่สุด

การเรียนรู้แบบเสริมกำลังใช้เพื่อฝึกให้หุ่นยนต์ทำงานต่างๆ เช่น การเดิน รอบห้องและโปรแกรมซอฟต์แวร์อย่างเช่น AlphaGo เล่นเกม Go

Generative AI

Generative AI เป็นโมเดลประเภทหนึ่ง ที่สร้างเนื้อหาจากข้อมูลจากผู้ใช้ เช่น Generative AI สามารถสร้าง ภาพที่ไม่ซ้ำใคร บทประพันธ์เพลง และมุกตลก สามารถสรุปบทความ อธิบายวิธีการทำงานหรือแก้ไขรูปภาพ

Generative AI สามารถรับอินพุตที่หลากหลายและสร้างเอาต์พุตที่หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ นอกจากนี้ยังสามารถนำ และสร้างการผสมผสานระหว่าง เหล่านี้ ตัวอย่างเช่น โมเดลสามารถถ่ายภาพเป็นอินพุตและสร้างรูปภาพและ ข้อความเป็นเอาต์พุต หรือถ่ายภาพและข้อความเป็นอินพุต แล้วสร้างวิดีโอเป็นเอาต์พุต

เราสามารถพูดถึงโมเดล Generative จากข้อมูลและเอาต์พุตของโมเดล Generative AI ซึ่งมักเขียนขึ้นมา เป็น "ประเภทอินพุต" เป็น "ประเภทเอาต์พุต" ตัวอย่างต่อไปนี้เป็นส่วนหนึ่งของ รายการอินพุตและเอาต์พุตบางส่วนสำหรับโมเดล Generative:

  • แปลงข้อความเป็นข้อความ
  • ข้อความเป็นรูปภาพ
  • การแปลงข้อความเป็นวิดีโอ
  • แปลงข้อความเป็นโค้ด
  • การอ่านออกเสียงข้อความ
  • รูปภาพและข้อความเป็นรูปภาพ

ตารางต่อไปนี้แสดงตัวอย่างโมเดล Generative, อินพุต และ ตัวอย่างเอาต์พุตที่เป็นไปได้

รุ่น อินพุต ตัวอย่างเอาต์พุต
แปลงข้อความเป็นข้อความ ใครเป็นผู้คิดค้นการแข่งขัน Le Mans 24 Hours of Le Mans ก่อตั้งโดย Automobile Club de l'Ouest (ACO) องค์กรยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้น ในวันที่ 26 และ 27 พฤษภาคม 1923 ที่เส้นทาง Sarthe Circuit ระยะทาง 13.426 กิโลเมตร วงจรถนน (8.345 ไมล์) ใกล้กับเมืองเลอมองส์ในฝรั่งเศส แนวคิดเดิมของการแข่งขันเป็นวิธีในการส่งเสริม ACO และ ภูมิภาคซาร์ต
แหล่งที่มา: Bard
ข้อความเป็นรูปภาพ ปลาหมึกยักษ์ลอยอยู่ในพอร์ทัลที่กำลังอ่านหนังสือพิมพ์ รูปการ์ตูนหมึกยักษ์
แหล่งที่มา: Imagen
การแปลงข้อความเป็นวิดีโอ ตุ๊กตาหมีสมจริงในมหาสมุทรที่ซานฟรานซิสโก ตุ๊กตาหมีอยู่ใต้น้ำ หมีเท็ดดี้กำลังว่ายน้ำ ผืนน้ำที่มีปลาสีสันสดใส หมีแพนด้ากำลังว่ายน้ำ วิดีโอตุ๊กตาหมีกำลังว่ายน้ำใต้น้ำ
แหล่งที่มา: Phenaki
แปลงข้อความเป็นโค้ด เขียนลูป Python ที่วนซ้ำรายการตัวเลขแล้วพิมพ์จำนวนเฉพาะ
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

แหล่งที่มา: Bard
การแปลงรูปภาพเป็นข้อความ รูปนกฟลามิงโก นี่คือนกฟลามิงโก โดยพบในทะเลแคริบเบียน
ที่มา: DeepMind ของ Google

Generative AI ทำงานอย่างไร ในระดับสูง โมเดล Generative จะเรียนรู้ รูปแบบในข้อมูลโดยมีเป้าหมายในการสร้างข้อมูลใหม่ที่คล้ายกัน สร้างขึ้น โมเดลมีลักษณะดังต่อไปนี้

  • นักแสดงตลกที่เรียนรู้ที่จะเลียนแบบผู้อื่นโดยการสังเกตพฤติกรรมของผู้คน สไตล์การพูด
  • ศิลปินที่เรียนวาดภาพในสไตล์ที่เจาะจงจากการศึกษาเกี่ยวกับ ภาพวาดในรูปแบบนั้น
  • วงคัฟเวอร์ที่เรียนรู้ที่จะออกเสียงให้เหมือนกลุ่มเพลงที่เจาะจงด้วยการฟัง เพลงจำนวนมากของกลุ่มนั้น

โมเดล Generative ได้รับการฝึกเบื้องต้น เพื่อสร้างเอาต์พุตที่ไม่เหมือนใครและสร้างสรรค์ โดยใช้วิธีการที่ไม่มีการควบคุมดูแล โดยโมเดลจะเรียนรู้การเลียนแบบข้อมูล ที่ได้รับการฝึกมา บางครั้งโมเดลจะได้รับการฝึกเพิ่มเติมโดยใช้การควบคุมดูแลหรือ การสนับสนุนการเรียนรู้ข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่โมเดลอาจ ขอให้ดำเนินการ เช่น สรุปบทความหรือแก้ไขรูปภาพ

Generative AI เป็นเทคโนโลยีที่พัฒนาอย่างรวดเร็วโดยมีกรณีการใช้งานใหม่ๆ อย่างต่อเนื่อง ให้ค้นพบได้ ตัวอย่างเช่น โมเดล Generative ช่วยให้ธุรกิจต่างๆ ปรับแต่ง รูปภาพผลิตภัณฑ์อีคอมเมิร์ซของตนด้วยการนำพื้นหลังที่รบกวนสายตาออกโดยอัตโนมัติ หรือการปรับปรุงคุณภาพของภาพที่มีความละเอียดต่ำ