โหมดตัวแทน

เอกสารนี้อธิบายโหมดตัวแทนใน Gemini Code Assist

โหมด Agent พร้อมใช้งานในสภาพแวดล้อมในการพัฒนาซอฟต์แวร์แบบรวม (IDE) ของ VS Code และ IntelliJ หากต้องการเริ่มใช้โหมดตัวแทน โปรดดูใช้แชทแบบตัวแทนเป็นโปรแกรมเมอร์คู่

โหมด Agent ใน VS Code ทำงานโดย Gemini CLI

โหมด Agent ใน IntelliJ ไม่ได้ใช้ Gemini CLI

เมื่อใช้โหมดตัวแทน คุณจะทำสิ่งต่อไปนี้และอื่นๆ ได้

  • ถามคำถามเกี่ยวกับโค้ด
  • ใช้บริบทและเครื่องมือในตัวเพื่อปรับปรุงเนื้อหาที่สร้างขึ้น
  • กำหนดค่าเซิร์ฟเวอร์ MCP เพื่อขยายความสามารถของเอเจนต์
  • รับวิธีแก้ปัญหาสำหรับงานที่ซับซ้อนซึ่งมีหลายขั้นตอน
  • สร้างโค้ดจากเอกสารการออกแบบ ปัญหา และTODOความคิดเห็น
  • ควบคุมลักษณะการทำงานของเอเจนต์โดยการแสดงความคิดเห็น แก้ไข และอนุมัติแผน และการใช้เครื่องมือในระหว่างการดำเนินการ

วิธีการทำงานของโหมดตัวแทน

ในโหมดตัวแทน ระบบจะส่งพรอมต์ของคุณไปยัง Gemini API พร้อมกับรายการเครื่องมือที่พร้อมใช้งาน Gemini API จะประมวลผลพรอมต์และแสดงคำตอบ คำตอบอาจเป็นคำตอบโดยตรง หรือคำขอให้ใช้เครื่องมือที่มีอยู่

เมื่อมีการขอใช้เครื่องมือ เจ้าหน้าที่จะเตรียมใช้เครื่องมือและตรวจสอบว่า ได้รับอนุญาตให้ใช้เครื่องมือโดยมีหรือไม่มีสิทธิ์ที่ชัดเจนหรือไม่

  • สำหรับคำขอเครื่องมือที่แก้ไขระบบไฟล์หรือดำเนินการเปลี่ยนแปลง ในทรัพยากรใดๆ Gemini จะขอให้คุณอนุญาตการดำเนินการ เว้นแต่คุณจะกำหนดค่า Gemini ให้อนุญาตเครื่องมือ หรือเครื่องมือต่างๆ เสมอ
  • คำขอเครื่องมือที่เป็นแบบอ่านอย่างเดียวอาจไม่ขอสิทธิ์ก่อนที่จะทำงานให้เสร็จ

เมื่อระบบขออนุญาตให้ใช้เครื่องมือ คุณสามารถเลือกอนุญาตหรือปฏิเสธ การดำเนินการได้ นอกจากนี้ ตัวแทนยังอาจให้ตัวเลือกในการอนุญาตเครื่องมือหรือเซิร์ฟเวอร์เสมอ หรืออนุญาตการดำเนินการที่คล้ายกัน ดูข้อมูลเพิ่มเติมได้ที่ อนุญาตการดำเนินการของเอเจนต์เสมอ

เมื่อได้รับสิทธิ์ให้ใช้เครื่องมือหรือให้สิทธิ์ด้วยตนเองแล้ว เจ้าหน้าที่จะใช้เครื่องมือ เพื่อดำเนินการที่จำเป็นให้เสร็จสมบูรณ์ และระบบจะส่งผลลัพธ์ของการดำเนินการนั้น กลับไปยัง Gemini API Gemini จะประมวลผลผลลัพธ์ของการดำเนินการด้วยเครื่องมือและสร้างคำตอบอื่น วงจรการดำเนินการและการประเมินนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสมบูรณ์

สำหรับงานที่ซับซ้อน Gemini อาจแสดงแผนระดับสูงเพื่อให้คุณอนุมัติ คุณสามารถปรับแต่งแผนและถามคำถามในแชทก่อนเริ่มกระบวนการได้ เมื่อพอใจกับแผนแล้ว คุณก็อนุมัติได้ หลังจากที่คุณอนุมัติแผนแล้ว ตัวแทนจะเริ่มทำงานแรก และจะขอคำชี้แจงหรือสิทธิ์จากคุณตามที่จำเป็นขณะที่ดำเนินการตามแผน

บริบทของโหมด Agent

บริบทช่วยให้ตัวแทนสร้างคำตอบที่ดีขึ้นสำหรับพรอมต์ที่ระบุ บริบท สามารถนำมาจากไฟล์ใน IDE, ไฟล์ในโฟลเดอร์ระบบในเครื่อง, คำตอบของเครื่องมือ และรายละเอียดพรอมต์

บริบทต่างๆ อาจพร้อมใช้งานสำหรับเอเจนต์ ทั้งนี้ขึ้นอยู่กับ IDE และการตั้งค่า

แท็บต่อไปนี้จะแสดงรายละเอียดวิธีรวบรวมบริบทสำหรับ IDE ต่างๆ

VS Code

โดยปกติแล้ว Gemini Code Assist ในโหมดเอเจนต์จะมีวิธีการรับบริบทต่อไปนี้

  • ข้อมูลในพื้นที่ทำงานของ IDE
  • คำตอบของเครื่องมือจากเครื่องมือในตัว เช่น grep, เทอร์มินัล, การอ่านไฟล์ หรือ การเขียนไฟล์
  • คำตอบของ Google Search
  • เนื้อหาจาก URL ที่ระบุในพรอมต์หรือโดยเครื่องมือ
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

หน่วยความจำของ Agent

โหมด Agent ของ Gemini Code Assist ใน VS Code ใช้ประโยชน์จาก บริการค้นหาหน่วยความจำของ Gemini CLI เพื่อค้นหาและโหลดGEMINI.md ไฟล์ที่ให้บริบทแก่ Agent บริการค้นหาความทรงจำ จะค้นหาไฟล์เหล่านี้ตามลำดับชั้น โดยเริ่มจากไดเรกทอรีการทำงานปัจจุบัน และย้ายขึ้นไปยังรูทของโปรเจ็กต์และไดเรกทอรีบ้าน นอกจากนี้ ยัง ค้นหาในไดเรกทอรีย่อยด้วย

คุณสร้างไฟล์บริบทได้ในระดับส่วนกลาง ระดับโปรเจ็กต์ และระดับคอมโพเนนต์ ซึ่งจะรวมกันเพื่อให้ โมเดลได้รับข้อมูลที่เกี่ยวข้องมากที่สุด

คุณใช้คำสั่ง /memory show เพื่อดูเนื้อหาที่รวมกันของไฟล์ GEMINI.md ที่โหลดทั้งหมด และใช้คำสั่ง /memory refresh เพื่อโหลดไฟล์เหล่านั้นซ้ำได้

IntelliJ

โดยปกติแล้ว Gemini Code Assist ในโหมดเอเจนต์จะมีวิธีการรับบริบทต่อไปนี้

  • ข้อมูลในโปรเจ็กต์ IDE รวมถึงไฟล์ สัญลักษณ์ที่จัดทำดัชนี และการใช้สัญลักษณ์ในโปรเจ็กต์
  • คำตอบของเครื่องมือจากเครื่องมือในตัว เช่น grep, file read หรือ file write
  • การควบคุมเวอร์ชันของ IntelliJ
  • เซิร์ฟเวอร์และเครื่องมือ MCP ที่กำหนดค่าไว้
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

คุณดูบริบทที่ตัวแทนใช้ได้ในลิ้นชักบริบทใน พื้นที่พรอมต์แชทโหมดตัวแทน

ลิ้นชักบริบทของโหมดตัวแทน

เครื่องมือ

เครื่องมือเป็นหมวดหมู่บริการที่กว้างซึ่งเอเจนต์สามารถใช้เพื่อบริบทและ การดำเนินการในการตอบกลับพรอมต์ของคุณ เครื่องมือช่วยให้ตัวแทนเข้าถึงข้อมูลล่าสุด ผ่านการเรียกใช้ฟังก์ชันไปยังปลายทาง API หรือตัวแทนอื่นๆ เครื่องมือ อาจมีฟังก์ชันเดียวหรือมีฟังก์ชันที่เกี่ยวข้องหลายอย่าง

ตัวอย่างเครื่องมือบางอย่าง ได้แก่ เครื่องมือในตัว เช่น grep และการอ่านหรือเขียนไฟล์ เซิร์ฟเวอร์ Model Context Protocol (MCP) ในเครื่องหรือระยะไกลและฟังก์ชันที่เรียกใช้งานได้ รวมถึงการเรียก API แบบ RESTful

เครื่องมือในตัว

ในโหมดตัวแทน Gemini จะมีสิทธิ์เข้าถึงเครื่องมือระบบในตัว เลือก IDE เพื่อดูรายการเครื่องมือในตัวที่ Gemini ใช้ได้ในโหมดเอเจนต์

VS Code

เครื่องมือในตัวของ Gemini CLI ทั้งหมด พร้อมใช้งานในโหมดตัวแทนใน Gemini Code Assist

IntelliJ

read_file
ดึงเนื้อหาข้อความของไฟล์โดยใช้เส้นทางที่สมบูรณ์
write_file
เขียนข้อความที่ระบุลงในไฟล์ที่ระบุ และสร้างไฟล์หากไม่มี
analyze_current_file
วิเคราะห์ไฟล์ที่เปิดในเครื่องมือแก้ไขเพื่อหาข้อผิดพลาดและคำเตือน
find_files
ค้นหาเส้นทางสัมบูรณ์ไปยังไฟล์โดยระบุชื่อไฟล์หรือส่วนหนึ่งของเส้นทาง
grep
ค้นหาไฟล์ทั้งหมดภายในโปรเจ็กต์ที่มีรูปแบบข้อความหรือนิพจน์ทั่วไปที่ระบุ
list_files
แสดงรายการไฟล์และไดเรกทอรีทั้งหมดในเส้นทางแบบสัมบูรณ์ที่ระบุ
resolve_symbol
แก้ไขการอ้างอิงสัญลักษณ์ที่เฉพาะเจาะจงเป็นการประกาศเดิม
find_usages
ค้นหาการอ้างอิงทั้งหมดในการประกาศสัญลักษณ์ที่ระบุในโปรเจ็กต์
git
เรียกใช้คำสั่งอินเทอร์เฟซบรรทัดคำสั่ง (CLI) ของ Git และแสดงผลลัพธ์
list_vcs_roots
แสดงผลรูทของระบบควบคุมเวอร์ชัน (VCS) ทั้งหมด เช่น ที่เก็บข้อมูล Git ในโปรเจ็กต์ปัจจุบัน

ข้อจำกัด

ฟีเจอร์บางอย่างของแชท Gemini Code Assist มาตรฐาน อาจไม่พร้อมใช้งานในโหมดเอเจนต์หรืออาจทำงานแตกต่างจากใน แชทมาตรฐาน

การท่องจำไม่พร้อมใช้งานในโหมดตัวแทน ขณะอยู่ในโหมดตัวแทน Gemini จะไม่อ้างอิงแหล่งที่มา และคุณจะปิดใช้คำแนะนำโค้ดที่ตรงกับแหล่งที่มาที่อ้างอิงไม่ได้

ขั้นตอนถัดไป