อภิธานศัพท์แมชชีนเลิร์นนิง: Agentic

หน้านี้มีคำศัพท์เฉพาะของ Agentic ดูคำศัพท์ทั้งหมดได้โดยคลิกที่นี่

A

ดำเนินการ

#agent

ขั้นตอนในลูปเอเจนต์ที่เอเจนต์ ดำเนินการที่เลือกไว้ในขั้นตอนเหตุผล เช่น ขั้นตอนการดำเนินการอาจส่งคำขอ API

การดำเนินการ

#agent

ในการเรียนรู้แบบเสริมกำลัง กลไกที่เอเจนต์ เปลี่ยนผ่านระหว่างสถานะของ สภาพแวดล้อม เอเจนต์จะเลือกการดำเนินการโดยใช้นโยบาย

พื้นที่การทำงาน

#agent

ชุดทรัพยากรที่เอเจนต์ใช้เพื่อทำงาน พื้นที่การดำเนินการอาจรวมถึงเครื่องมือและ API ที่เอเจนต์เรียกใช้ได้ รวมถึงสิทธิ์ที่เอเจนต์มี โดยทั่วไปแล้ว พื้นที่การดำเนินการควรมีขนาดใหญ่พอสำหรับเอเจนต์ ในการทำงาน หากพื้นที่การดำเนินการมีขนาดเล็กเกินไป เอเจนต์อาจมีทรัพยากรไม่เพียงพอที่จะทำงาน หากพื้นที่การดำเนินการมีขนาดใหญ่เกินไป เอเจนต์มักจะเกิดข้อผิดพลาดได้ง่ายขึ้น

ตัวแทน

#generativeAI
#agent

ซอฟต์แวร์ที่สามารถให้เหตุผลเกี่ยวกับอินพุตของผู้ใช้เพื่อวางแผนและดำเนินการในนามของผู้ใช้

ในการเรียนรู้แบบเสริมกำลัง เอเจนต์คือเอนทิตีที่ใช้นโยบายเพื่อเพิ่มผลตอบแทนที่คาดไว้ให้ได้มากที่สุด ซึ่งได้จากการ เปลี่ยนสถานะของสภาพแวดล้อม

เป็น Agent

#generativeAI
#agent

รูปแบบคำคุณศัพท์ของagent Agentic หมายถึงคุณสมบัติ ที่เอเจนต์มี (เช่น ความเป็นอิสระ)

Agentic Loop

#agent

รอบที่เอเจนต์ทำซ้ำจนกว่าจะตรงตามเงื่อนไขการสิ้นสุด วงจรนี้มักประกอบด้วย 4 ระยะต่อไปนี้

  1. สังเกต
  2. เหตุผล
  3. Act
  4. ความคิดเห็น

เวิร์กโฟลว์ของ Agentic AI

#generativeAI
#agent

กระบวนการแบบไดนามิกที่เอเจนต์วางแผนและ ดำเนินการโดยอัตโนมัติเพื่อบรรลุเป้าหมาย กระบวนการนี้อาจเกี่ยวข้องกับการให้เหตุผล การเรียกใช้เครื่องมือภายนอก และการแก้ไขแผนด้วยตนเอง

การจัดการ Agent เป็นกลุ่ม

#agent

การจัดการและการกำหนดเส้นทางของงานแบบรวมศูนย์ในตัวแทนย่อยหลายรายหรือการเรียก LLM การประสานงานของเอเจนต์ จะแบ่งงานที่ซับซ้อนออกเป็นงานย่อยๆ และมอบหมายงานเหล่านั้น ให้กับเอเจนต์ย่อยที่มีความสามารถมากที่สุด

เอเจนต์อัตโนมัติ

#agent

เอเจนต์ที่ทำงานเพื่อให้บรรลุเป้าหมายที่ซับซ้อนด้วยการวางแผน ดำเนินการ และปรับตัวโดยไม่ต้องมีการแทรกแซงจากมนุษย์อย่างต่อเนื่อง

E

เอเจนต์ผู้ประเมิน

#agent

Agent ที่ประเมินผลลัพธ์ของ Agent อื่นก่อนที่ผลลัพธ์เหล่านั้นจะ เสร็จสมบูรณ์ คุณนึกภาพได้ว่าเอเจนต์หนึ่งเป็นผู้ผลิตผลิตภัณฑ์และอีกเอเจนต์หนึ่งซึ่งแยกกัน (เอเจนต์ผู้ประเมิน) เป็นผู้ทดสอบผลิตภัณฑ์นั้นก่อนที่จะเผยแพร่

Critic เป็นคำพ้องความหมายของเอเจนต์ผู้ประเมิน

F

ความคิดเห็น

#agent

ขั้นตอนในลูปเอเจนต์ที่เอเจนต์ประเมินการดำเนินการที่ทำในขั้นตอนการดำเนินการ ตัวอย่างเช่น หากตัวแทนส่งคำขอ API ในระหว่างขั้นตอนการดำเนินการ ขั้นตอนการให้ความคิดเห็นอาจพิจารณาว่าการตอบกลับจาก API สำเร็จหรือไม่

G

โมเดลต่างๆ ของ Gemini

#generativeAI
#agent

Transformer ที่ทันสมัยของ Google โมเดลหลายรูปแบบ โมเดล Gemini ออกแบบมาโดยเฉพาะ เพื่อผสานรวมกับเอเจนต์

ผู้ใช้โต้ตอบกับโมเดล Gemini ได้หลายวิธี รวมถึงผ่าน อินเทอร์เฟซกล่องโต้ตอบแบบอินเทอร์แอกทีฟและผ่าน SDK

เอเจนต์แบบ Generative (ภาพจำลอง)

#agent

เอเจนต์ที่มีลักษณะเฉพาะตัว ความทรงจำ และกิจวัตรที่จำลอง พฤติกรรมของมนุษย์ที่สมจริง

ดูรายละเอียดได้ที่Generative Agents: Interactive Simulacra of Human Behavior

M

ตัวแทนผู้จัดการ

#agent

เอเจนต์ที่ควบคุมเอเจนต์ย่อยอย่างน้อย 1 ราย

การทำงานร่วมกันแบบหลาย Agent

#agent

เฟรมเวิร์กที่ AI Agent เฉพาะทางหลายตัวโต้ตอบ อภิปราย หรือส่งต่อ งานให้กันเพื่อแก้ปัญหาที่ซับซ้อน

O

สังเกต

#agent

ขั้นตอนในลูปของเอเจนต์ที่เอเจนต์ตรวจสอบหรือประเมิน แง่มุมบางอย่างของความคืบหน้าของเอเจนต์ ตัวอย่างเช่น สมมติว่าขั้นตอน act สร้างโค้ดบางส่วน ดังนั้น ขั้นตอนสังเกต อาจเรียกใช้การทดสอบในโค้ดที่สร้างขึ้น

P

วางแผนและแก้ปัญหา

#agent

กลยุทธ์แบบเอเจนต์ที่โมเดลร่างแผนแบบหลายขั้นตอนที่ชัดเจนก่อน พยายามดำเนินการใดๆ

ปลั๊กอิน

#agent

เครื่องมือแบบแยกส่วนที่ได้มาตรฐานซึ่งสามารถแนบไปกับเอเจนต์ได้อย่างง่ายดาย เพื่อขยายความสามารถของเอเจนต์ ตัวอย่างเช่น ปลั๊กอิน GitHub ช่วยให้ เอเจนต์ดำเนินการต่างๆ ได้ เช่น อ่านปัญหาใน GitHub และสร้างคำขอ ดึงข้อมูล

ความจำเชิงกระบวนการ

#agent

ในเอเจนต์ ความรู้เกี่ยวกับวิธีทำสิ่งต่างๆ ตัวอย่างเช่น เอเจนต์อาจพัฒนาความจำเชิงกระบวนการเกี่ยวกับวิธีค้นหาเว็บและ แสดงเว็บไซต์ 3 อันดับแรก

R

เหตุผล

#agent

ขั้นตอนในลูปของเอเจนต์ที่เอเจนต์จะพิจารณาว่าจะทำอะไร ตัวอย่างเช่น เอเจนต์อาจพิจารณาว่าควรส่งคำขอ API ที่เฉพาะเจาะจง

ทบทวนความคิด

#generativeAI
#agent

กลยุทธ์ในการปรับปรุงคุณภาพของเวิร์กโฟลว์แบบเอเจนต์โดยการตรวจสอบ (พิจารณา) เอาต์พุตของขั้นตอนก่อนที่จะส่งเอาต์พุตนั้นไปยังขั้นตอนถัดไป

โดยปกติแล้ว ผู้ตรวจสอบจะเป็น LLM ตัวเดียวกับที่สร้างคำตอบ (แม้ว่าอาจเป็น LLM อื่นก็ได้) LLM เดียวกันที่สร้างคำตอบจะเป็นผู้ตัดสินที่ยุติธรรมสำหรับคำตอบของตัวเองได้อย่างไร "เคล็ดลับ" คือการทำให้ LLM มีความคิดเชิงวิพากษ์ (ไตร่ตรอง) กระบวนการนี้คล้ายกับนักเขียนที่ใช้ความคิดสร้างสรรค์ ในการเขียนฉบับร่างแรก แล้วเปลี่ยนไปใช้ความคิดเชิงวิพากษ์ เพื่อแก้ไข

ตัวอย่างเช่น ลองนึกถึงเวิร์กโฟลว์แบบเอเจนต์ซึ่งมีขั้นตอนแรกเป็นการสร้าง ข้อความสำหรับแก้วกาแฟ ข้อความแจ้งสำหรับขั้นตอนนี้อาจเป็น

คุณเป็นครีเอเตอร์ สร้างข้อความตลกๆ ที่ไม่ซ้ำใครซึ่งมีความยาวไม่เกิน 50 อักขระ เหมาะสำหรับแก้วกาแฟ

ตอนนี้ลองนึกถึงพรอมต์การไตร่ตรองต่อไปนี้

คุณเป็นคนดื่มกาแฟ คุณคิดว่าคำตอบก่อนหน้านี้ตลกไหม

จากนั้นเวิร์กโฟลว์อาจส่งต่อเฉพาะข้อความที่ได้รับคะแนนการสะท้อนสูง ไปยังขั้นตอนถัดไป

ตัวแทนเราเตอร์

#agent

เอเจนต์ที่จัดประเภทคำค้นหาของผู้ใช้ แล้วเรียกใช้เอเจนต์ที่เหมาะสมที่สุดเพื่อจัดการคำค้นหานั้น

S

การแก้ไขตนเอง

#agent

ความสามารถของเอเจนต์ในการตรวจหาข้อผิดพลาดในเอาต์พุตของตัวเอง แล้วลองใช้วิธีอื่น

รัฐ

#agent

ในการเรียนรู้แบบเสริมกำลัง ค่าพารามิเตอร์ที่อธิบายการกำหนดค่าปัจจุบันของสภาพแวดล้อม ซึ่งเอเจนต์ใช้เพื่อเลือกการดำเนินการ

เอเจนต์เครื่องสถานะ

#agent

ตัวแทนที่มีเวิร์กโฟลว์ถูกจำกัดด้วยกฎที่เข้มงวด โดยทั่วไปแล้วเอเจนต์เครื่องสถานะจะทำผิดพลาดน้อยกว่าเอเจนต์อัตโนมัติ แต่ไม่มีอิสระในการปรับตัวให้เข้ากับสถานการณ์ที่อยู่นอกเหนือข้อจำกัด

Agent ย่อย

#agent

โมเดลเฉพาะทางที่มุ่งเน้นอย่างแคบๆ ซึ่งเรียกใช้โดย Agent ผู้จัดการ เพื่อจัดการชุดย่อยที่เฉพาะเจาะจงของปัญหาที่ใหญ่กว่า โดยทั่วไปแล้ว เอเจนต์ย่อยจะมีพื้นที่การดำเนินการที่แคบกว่าเอเจนต์

T

เงื่อนไขการสิ้นสุด

#agent

ใน AI แบบเอเจนต์ เกณฑ์ที่กำหนดไว้ล่วงหน้าซึ่งจะบอกให้เอเจนต์ หยุดการวนซ้ำ ตัวอย่างเงื่อนไขการสิ้นสุดที่เป็นไปได้มีดังนี้

  • ตัวแทนทำเป้าหมายสำเร็จแล้ว
  • เอเจนต์ใช้ทรัพยากรเพิ่มเติมไม่ได้
  • human-in-the-loopตรวจพบปัญหา

ในการเรียนรู้แบบเสริมกำลัง เงื่อนไขที่กำหนดเวลาสิ้นสุดตอน เช่น เมื่อเอเจนต์ไปถึงสถานะหนึ่งๆ หรือเกินจำนวนการเปลี่ยนสถานะตามเกณฑ์ ตัวอย่างเช่น ในเกม Tic-Tac-Toe (หรือที่รู้จักกันในชื่อเกม O-X) ตอนจะจบลงเมื่อผู้เล่นทำเครื่องหมาย ในช่อง 3 ช่องติดต่อกันหรือเมื่อมีการทำเครื่องหมายในทุกช่อง