Thiết kế câu lệnh cho Gemini Nano

Khi sử dụng Prompt API, bạn có thể sử dụng các chiến lược cụ thể để điều chỉnh câu lệnh và nhận được kết quả tối ưu. Trang này mô tả các phương pháp hay nhất để định dạng câu lệnh cho Gemini Nano.

Để biết thêm hướng dẫn chung về thiết kế câu lệnh, hãy xem Tài liệu tham khảo về thiết kế câu lệnh, Thiết kế câu lệnh cho AI tạo sinhChiến lược thiết kế câu lệnh.

Ngoài ra, để tự động tinh chỉnh và cải thiện câu lệnh, bạn có thể sử dụng trình tối ưu hoá không cần dữ liệu. Trình tối ưu hoá này có thể nhắm đến các mô hình trên thiết bị, chẳng hạn như gemma-3n-e4b-it.

Các phương pháp hay nhất về thiết kế câu lệnh

Khi thiết kế câu lệnh cho Prompt API, hãy sử dụng các kỹ thuật sau:

  • Cung cấp ví dụ về học tập theo bối cảnh. Thêm các ví dụ được phân phối hợp lý vào câu lệnh để cho Gemini Nano biết loại kết quả mà bạn mong đợi.

    Hãy cân nhắc sử dụng tính năng lưu vào bộ nhớ đệm tiền tố khi bạn sử dụng tính năng học tập trong bối cảnh, vì việc cung cấp ví dụ sẽ khiến câu lệnh dài hơn và tăng thời gian suy luận.

  • Trình bày ngắn gọn. Phần mở đầu dài dòng kèm theo hướng dẫn lặp lại có thể tạo ra kết quả không tối ưu. Hãy đảm bảo câu lệnh của bạn tập trung và đi thẳng vào vấn đề.

  • Cấu trúc câu lệnh để tạo ra các câu trả lời hiệu quả hơn, chẳng hạn như mẫu câu lệnh mẫu này xác định rõ ràng các hướng dẫn, ràng buộc và ví dụ.

  • Đưa ra kết quả ngắn gọn. Tốc độ suy luận của LLM phụ thuộc nhiều vào độ dài đầu ra. Hãy cân nhắc kỹ cách bạn có thể tạo ra kết quả ngắn nhất có thể cho trường hợp sử dụng của mình và xử lý hậu kỳ theo cách thủ công để cấu trúc kết quả theo định dạng mong muốn.

  • Thêm dấu phân cách. Sử dụng các dấu phân cách như <background_information>, <instruction>## để phân tách các phần khác nhau trong câu lệnh của bạn. Việc sử dụng ## giữa các thành phần là đặc biệt quan trọng đối với Gemini Nano, vì điều này giúp giảm đáng kể khả năng mô hình không diễn giải chính xác từng thành phần.

  • Ưu tiên logic đơn giản và một nhiệm vụ tập trung hơn. Nếu bạn gặp khó khăn trong việc đạt được kết quả tốt với một câu lệnh yêu cầu suy luận nhiều bước (ví dụ: trước tiên hãy làm X, nếu kết quả của X là A thì làm M; nếu không thì làm N; sau đó làm Y...), hãy cân nhắc chia nhỏ tác vụ và để mỗi lệnh gọi Gemini Nano xử lý một tác vụ cụ thể hơn, đồng thời sử dụng mã để liên kết nhiều lệnh gọi với nhau.

  • Sử dụng giá trị nhiệt độ thấp hơn cho các tác vụ xác định. Đối với những tác vụ như trích xuất thực thể hoặc dịch thuật không dựa vào khả năng sáng tạo, hãy cân nhắc bắt đầu với giá trị temperature0.2 và điều chỉnh giá trị này dựa trên quá trình kiểm thử của bạn.