ข้อมูลเบื้องต้น: โมเดลการสร้างข้อมูลคืออะไร

"generative" ในที่นี้หมายถึงชื่อ "Generative Adversarial Network"? "Generative" อธิบายคลาสของโมเดลทางสถิติที่คอนทราสต์กับโมเดลเลือกปฏิบัติ

อย่างไม่เป็นทางการ:

  • โมเดลที่สร้างขึ้นจะสร้างอินสแตนซ์ข้อมูลใหม่ได้
  • รูปแบบที่เลือกปฏิบัติจะแบ่งแยกระหว่างอินสแตนซ์ข้อมูลประเภทต่างๆ

โมเดลสร้างพันธ์ุสามารถสร้างรูปภาพใหม่ๆ ของสัตว์ที่ดูเหมือนสัตว์จริงๆ ส่วนโมเดลการเลือกปฏิบัติอาจให้สุนัขพันธุ์แมวใส่สุนัขก็ได้ ส่วน GANs เป็นโมเดลการสร้างพันธ์ุเพียงอย่างเดียว

เป็นทางการมากขึ้นเนื่องจากชุดของข้อมูล X และชุดป้ายกํากับ Y มีลักษณะดังนี้

  • โมเดล Generative จะบันทึกความน่าจะเป็นของจุดร่วม p(X, Y) หรือเพียง p(X) หากไม่มีป้ายกํากับ
  • โมเดลการเลือกปฏิบัติจะบันทึกความน่าจะเป็นตามเงื่อนไข p(Y | X)

โมเดล Generate ประกอบด้วยการกระจายตัวข้อมูลเองและบอกคุณถึงตัวอย่างที่เจาะจง เช่น โมเดลที่คาดการณ์คําถัดไปในลําดับมักเป็นโมเดลการสร้าง (โดยปกติจะง่ายกว่า GAN) เนื่องจากสามารถกําหนดความน่าจะเป็นให้กับลําดับของคําได้

โมเดลการเลือกปฏิบัติจะไม่สนใจคําถามว่าอินสแตนซ์หนึ่งๆ น่าจะมีแนวโน้มหรือไม่ และเพียงแค่บอกคุณว่าป้ายกํากับหนึ่งๆ มีแนวโน้มที่จะนําไปใช้กับอินสแตนซ์อย่างไร

โปรดทราบว่านี่เป็นคําจํากัดความที่กว้างมาก มีรูปแบบต่างๆ มากมาย มากมาย GANs เป็นเพียงโมเดลการสร้างคุณค่าอย่างหนึ่งเท่านั้น

ความน่าจะเป็นของการประมาณ

ทั้ง 2 รูปแบบไม่จําเป็นต้องแสดงตัวเลขที่แสดงถึงความน่าจะเป็น คุณสามารถจําลองการเผยแพร่ข้อมูลโดยการเลียนแบบการกระจายนั้น

เช่น ตัวแยกประเภทกีดกันอย่างเช่นต้นไม้แห่งการตัดสินใจจะติดป้ายกํากับอินสแตนซ์ได้โดยไม่ต้องกําหนดความน่าจะเป็นให้กับป้ายกํากับนั้น ตัวแยกประเภทดังกล่าวจะยังคงเป็นโมเดลอยู่เพราะการกระจายของป้ายกํากับที่คาดการณ์ทั้งหมดจะเป็นตัวจําลอง การกระจายป้ายกํากับในข้อมูล

ในทํานองเดียวกัน โมเดลการสร้างข้อมูลผู้ใช้สามารถสร้างโมเดลการกระจายข้อมูลได้โดยการสร้างข้อมูลการโน้มน้าว &ปลอม ที่แอบอ้างและมาจากการแจกจ่ายนั้น

โมเดลยุคใหม่ยาก

โมเดลทั่วไปจัดการกับงานที่ยากกว่าโมเดลสําหรับการเลือกปฏิบัติที่คล้ายกัน โมเดลที่สร้างจําลองจะต้องสร้างโมเดลเพิ่มเติม

โมเดลการสร้างรูปภาพอาจให้ความสัมพันธ์กันเช่น "สิ่งที่ดูเหมือนเรืออาจจะกําลังปรากฏอยู่ใกล้สิ่งที่ดูเหมือนน้ํา&คําพูด และ "ดวงตาไม่น่าจะปรากฏบนหน้าผาก" ทําให้เป็นรูปแบบ การกระจายที่ซับซ้อนมาก

ในทางตรงกันข้าม โมเดลที่แบ่งแยกอาจเรียนรู้ความแตกต่างระหว่าง "sailbo&" หรือ "ไม่ใช่ sailbo" โดยการมองหารูปแบบการเล่าเรื่องราวสัก 2-3 รูปแบบ โดยอาจละเว้นความสัมพันธ์หลายๆ อย่างที่โมเดลการสร้างต้องเกิดขึ้นอย่างถูกต้อง

โมเดลที่แบ่งแยกพยายามแสดงขอบเขตในพื้นที่ข้อมูล ขณะที่โมเดล Generation จะพยายามสร้างรูปแบบการวางข้อมูลภายในพื้นที่ทํางาน ตัวอย่างเช่น แผนภาพต่อไปนี้แสดงโมเดลของการเขียนด้วยลายมือที่เป็นการเลือกปฏิบัติและไม่แบ่งแยก

กราฟ 2 อัน อันที่มีป้ายกํากับว่า 'โมเดลที่แบ่งแยก' และอีกอันที่ติดป้ายกํากับ 'โมเดลทั่วไป' กราฟทั้ง 2 รายการจะแสดงจุดข้อมูล 4 จุดเดียวกัน แต่ละจุดจะมีป้ายกํากับเป็นรูปภาพตัวเลขที่เขียนด้วยลายมือซึ่งเป็นตัวแทน ในกราฟที่แบ่งเป็นช่องๆ จะมีเส้นไข่ปลาที่แยกจุดข้อมูล 2 จุดออกจากอีก 2 จุดที่เหลือ พื้นที่เหนือเส้นประจะมีป้ายกํากับเป็น 'y=0&#39 และภูมิภาคใต้บรรทัดมีป้ายกํากับ 'y=1' ในกราฟทั่วไป
          จะมีเส้นประ 2 เส้นวาดด้วยจุด 2 คู่ วงกลมด้านบนจะมีป้ายกํากับเป็น 'y=0&#39 และวงกลมด้านล่างจะมีป้ายกํากับเป็น ##39;y=1

รูปที่ 1: รูปแบบการเขียนด้วยลายมือที่มีการเลือกปฏิบัติและการสร้างขึ้นมา

โมเดลที่เลือกปฏิบัติจะพยายามแยกความแตกต่างระหว่าง 0&#39 และ 1&339 ที่เขียนด้วยลายมือโดยวาดเส้นในพื้นที่ข้อมูล หากได้บรรทัดที่ถูกต้อง ก็อาจแยก 0' ออกจาก 1&#39 โดยไม่ต้องสร้างแบบจําลองที่วางอินสแตนซ์ในพื้นที่ข้อมูลทั้ง 2 ด้านของบรรทัด

ในทางตรงกันข้าม โมเดลการสร้างนี้พยายามทําให้เกิดการโน้มน้าวแบบ 1 ' 0 และ #39; ด้วยการสร้างตัวเลขที่ตรงกับรูปแบบจริงของตนในพื้นที่ข้อมูล เพื่อจําลองการกระจายทั่วทั้งพื้นที่ข้อมูล

GANs มีวิธีที่มีประสิทธิภาพในการฝึกโมเดลสื่อสมบูรณ์ดังกล่าวให้มีลักษณะเหมือนการกระจายจริง ในการทําความเข้าใจวิธีการทํางาน เราจะต้องเข้าใจโครงสร้างพื้นฐานของ GAN

ตรวจสอบความเข้าใจ: โมเดลที่สร้างใหม่กับโมเดลที่แบ่งแยก

คุณมีคะแนน IQ สําหรับ 1,000 คน คุณต้องจําลองการกระจายคะแนน IQ ด้วยขั้นตอนต่อไปนี้
  1. ทอยลูกเต๋า 6 ด้าน
  2. คูณม้วนด้วยค่าคงที่เท่ากับ
  3. ทําซ้ํา 100 ครั้งและดูค่าเฉลี่ยของผลลัพธ์ทั้งหมด
คุณลองใช้ค่าที่แตกต่างกันสําหรับ w จนกว่าผลลัพธ์ของกระบวนการจะเท่ากับค่าเฉลี่ยของคะแนน IQ ที่แท้จริง โมเดลของคุณเป็นโมเดลการสร้างหรือโมเดลการเลือกปฏิบัติหรือไม่
โมเดลการสร้าง
ถูกต้อง: การม้วนหนังสือทุกชุดจะช่วยให้คุณสร้าง IQ ของบุคคลในจินตนาการได้อย่างมีประสิทธิภาพ นอกจากนี้ โมเดลการสร้างข้อมูลยังสะท้อนถึงข้อเท็จจริงที่ว่าคะแนน IQ จะกระจายไปตามปกติ (นั่นคือ บนกราฟระฆัง)
โมเดลการเลือกปฏิบัติ
ไม่ถูกต้อง: โมเดลการเลือกปฏิบัติที่คล้ายกันที่คล้ายกันจะพยายามเลือกระหว่างคะแนน IQ ประเภทต่างๆ กัน เช่น โมเดลการเลือกปฏิบัติอาจจําแนกประเภท IQ เป็น "จริง" หรือ "จริง"
มีข้อมูลไม่เพียงพอที่จะบอก
โมเดลนี้ไม่เหมาะกับคําจํากัดความของโมเดล 1 ใน 2 ประเภทนี้
โมเดลจะแสดงผลความน่าจะเป็นเมื่อคุณให้อินสแตนซ์ของข้อมูล โมเดลนี้เป็นโมเดลการสร้างหรือโมเดลการเลือกปฏิบัติหรือไม่
โมเดลการสร้าง
โมเดลรุ่นที่สร้างสามารถประเมินความน่าจะเป็นของอินสแตนซ์ รวมถึงความน่าจะเป็นของป้ายกํากับคลาส
โมเดลการเลือกปฏิบัติ
โมเดลที่เลือกปฏิบัติอาจประเมินความน่าจะเป็นที่อินสแตนซ์เป็นของคลาส
มีข้อมูลไม่เพียงพอที่จะบอก
ทั้งโมเดลที่สร้างและแบ่งแยกสามารถประมาณความน่าจะเป็นได้ (แต่ไม่จําเป็น)