"generative" ในที่นี้หมายถึงชื่อ "Generative Adversarial Network"? "Generative" อธิบายคลาสของโมเดลทางสถิติที่คอนทราสต์กับโมเดลเลือกปฏิบัติ
อย่างไม่เป็นทางการ:
- โมเดลที่สร้างขึ้นจะสร้างอินสแตนซ์ข้อมูลใหม่ได้
- รูปแบบที่เลือกปฏิบัติจะแบ่งแยกระหว่างอินสแตนซ์ข้อมูลประเภทต่างๆ
โมเดลสร้างพันธ์ุสามารถสร้างรูปภาพใหม่ๆ ของสัตว์ที่ดูเหมือนสัตว์จริงๆ ส่วนโมเดลการเลือกปฏิบัติอาจให้สุนัขพันธุ์แมวใส่สุนัขก็ได้ ส่วน GANs เป็นโมเดลการสร้างพันธ์ุเพียงอย่างเดียว
เป็นทางการมากขึ้นเนื่องจากชุดของข้อมูล X และชุดป้ายกํากับ Y มีลักษณะดังนี้
- โมเดล Generative จะบันทึกความน่าจะเป็นของจุดร่วม p(X, Y) หรือเพียง p(X) หากไม่มีป้ายกํากับ
- โมเดลการเลือกปฏิบัติจะบันทึกความน่าจะเป็นตามเงื่อนไข p(Y | X)
โมเดล Generate ประกอบด้วยการกระจายตัวข้อมูลเองและบอกคุณถึงตัวอย่างที่เจาะจง เช่น โมเดลที่คาดการณ์คําถัดไปในลําดับมักเป็นโมเดลการสร้าง (โดยปกติจะง่ายกว่า GAN) เนื่องจากสามารถกําหนดความน่าจะเป็นให้กับลําดับของคําได้
โมเดลการเลือกปฏิบัติจะไม่สนใจคําถามว่าอินสแตนซ์หนึ่งๆ น่าจะมีแนวโน้มหรือไม่ และเพียงแค่บอกคุณว่าป้ายกํากับหนึ่งๆ มีแนวโน้มที่จะนําไปใช้กับอินสแตนซ์อย่างไร
โปรดทราบว่านี่เป็นคําจํากัดความที่กว้างมาก มีรูปแบบต่างๆ มากมาย มากมาย GANs เป็นเพียงโมเดลการสร้างคุณค่าอย่างหนึ่งเท่านั้น
ความน่าจะเป็นของการประมาณ
ทั้ง 2 รูปแบบไม่จําเป็นต้องแสดงตัวเลขที่แสดงถึงความน่าจะเป็น คุณสามารถจําลองการเผยแพร่ข้อมูลโดยการเลียนแบบการกระจายนั้น
เช่น ตัวแยกประเภทกีดกันอย่างเช่นต้นไม้แห่งการตัดสินใจจะติดป้ายกํากับอินสแตนซ์ได้โดยไม่ต้องกําหนดความน่าจะเป็นให้กับป้ายกํากับนั้น ตัวแยกประเภทดังกล่าวจะยังคงเป็นโมเดลอยู่เพราะการกระจายของป้ายกํากับที่คาดการณ์ทั้งหมดจะเป็นตัวจําลอง การกระจายป้ายกํากับในข้อมูล
ในทํานองเดียวกัน โมเดลการสร้างข้อมูลผู้ใช้สามารถสร้างโมเดลการกระจายข้อมูลได้โดยการสร้างข้อมูลการโน้มน้าว &ปลอม ที่แอบอ้างและมาจากการแจกจ่ายนั้น
โมเดลยุคใหม่ยาก
โมเดลทั่วไปจัดการกับงานที่ยากกว่าโมเดลสําหรับการเลือกปฏิบัติที่คล้ายกัน โมเดลที่สร้างจําลองจะต้องสร้างโมเดลเพิ่มเติม
โมเดลการสร้างรูปภาพอาจให้ความสัมพันธ์กันเช่น "สิ่งที่ดูเหมือนเรืออาจจะกําลังปรากฏอยู่ใกล้สิ่งที่ดูเหมือนน้ํา&คําพูด และ "ดวงตาไม่น่าจะปรากฏบนหน้าผาก" ทําให้เป็นรูปแบบ การกระจายที่ซับซ้อนมาก
ในทางตรงกันข้าม โมเดลที่แบ่งแยกอาจเรียนรู้ความแตกต่างระหว่าง "sailbo&" หรือ "ไม่ใช่ sailbo" โดยการมองหารูปแบบการเล่าเรื่องราวสัก 2-3 รูปแบบ โดยอาจละเว้นความสัมพันธ์หลายๆ อย่างที่โมเดลการสร้างต้องเกิดขึ้นอย่างถูกต้อง
โมเดลที่แบ่งแยกพยายามแสดงขอบเขตในพื้นที่ข้อมูล ขณะที่โมเดล Generation จะพยายามสร้างรูปแบบการวางข้อมูลภายในพื้นที่ทํางาน ตัวอย่างเช่น แผนภาพต่อไปนี้แสดงโมเดลของการเขียนด้วยลายมือที่เป็นการเลือกปฏิบัติและไม่แบ่งแยก
รูปที่ 1: รูปแบบการเขียนด้วยลายมือที่มีการเลือกปฏิบัติและการสร้างขึ้นมา
โมเดลที่เลือกปฏิบัติจะพยายามแยกความแตกต่างระหว่าง 0' และ 1&339 ที่เขียนด้วยลายมือโดยวาดเส้นในพื้นที่ข้อมูล หากได้บรรทัดที่ถูกต้อง ก็อาจแยก 0' ออกจาก 1' โดยไม่ต้องสร้างแบบจําลองที่วางอินสแตนซ์ในพื้นที่ข้อมูลทั้ง 2 ด้านของบรรทัด
ในทางตรงกันข้าม โมเดลการสร้างนี้พยายามทําให้เกิดการโน้มน้าวแบบ 1 ' 0 และ #39; ด้วยการสร้างตัวเลขที่ตรงกับรูปแบบจริงของตนในพื้นที่ข้อมูล เพื่อจําลองการกระจายทั่วทั้งพื้นที่ข้อมูล
GANs มีวิธีที่มีประสิทธิภาพในการฝึกโมเดลสื่อสมบูรณ์ดังกล่าวให้มีลักษณะเหมือนการกระจายจริง ในการทําความเข้าใจวิธีการทํางาน เราจะต้องเข้าใจโครงสร้างพื้นฐานของ GAN
ตรวจสอบความเข้าใจ: โมเดลที่สร้างใหม่กับโมเดลที่แบ่งแยก
- ทอยลูกเต๋า 6 ด้าน
- คูณม้วนด้วยค่าคงที่เท่ากับ
- ทําซ้ํา 100 ครั้งและดูค่าเฉลี่ยของผลลัพธ์ทั้งหมด