Desain perintah untuk Gemini Nano

Saat menggunakan Prompt API, ada strategi khusus yang dapat Anda gunakan untuk menyesuaikan perintah dan menerima hasil yang optimal. Halaman ini menjelaskan praktik terbaik untuk memformat perintah untuk Gemini Nano.

Untuk panduan rekayasa perintah yang lebih umum, lihat Dokumen teknis Rekayasa Perintah, Rekayasa Perintah untuk AI Generatif, dan Strategi desain perintah.

Atau, untuk menyempurnakan dan meningkatkan kualitas perintah secara otomatis, Anda dapat menggunakan pengoptimal zero-shot, yang dapat menargetkan model di perangkat seperti gemma-3n-e4b-it.

Praktik terbaik desain perintah

Saat mendesain perintah untuk Prompt API, gunakan teknik berikut:

  • Berikan contoh untuk pembelajaran dalam konteks. Tambahkan contoh yang terdistribusi dengan baik ke perintah Anda untuk menunjukkan jenis hasil yang Anda harapkan kepada Gemini Nano.

    Pertimbangkan untuk menggunakan fitur caching awalan saat Anda menggunakan pembelajaran dalam konteks, karena memberikan contoh membuat perintah menjadi lebih panjang dan meningkatkan waktu inferensi.

  • Sampaikan dengan ringkas. Pengantar yang panjang dengan petunjuk yang berulang dapat menghasilkan hasil yang kurang optimal. Pastikan perintah Anda terfokus dan langsung pada intinya.

  • Struktur perintah untuk menghasilkan respons yang lebih efektif, seperti template perintah contoh ini yang dengan jelas menentukan petunjuk, batasan, dan contoh.

  • Buat output yang singkat. Kecepatan inferensi LLM sangat bergantung pada panjang output. Pertimbangkan dengan cermat cara menghasilkan output sesingkat mungkin untuk kasus penggunaan Anda dan lakukan pemrosesan pasca-manual untuk menyusun output dalam format yang diinginkan.

  • Tambahkan pembatas. Gunakan pembatas seperti <background_information>, <instruction>, dan ## untuk memisahkan berbagai bagian prompt Anda. Penggunaan ## di antara komponen sangat penting untuk Gemini Nano, karena secara signifikan mengurangi kemungkinan model gagal menafsirkan setiap komponen dengan benar.

  • Lebih menyukai logika sederhana dan tugas yang lebih fokus. Jika Anda merasa sulit mendapatkan hasil yang baik dengan perintah yang memerlukan penalaran multi-langkah (misalnya, lakukan X terlebih dahulu, jika hasil X adalah A, lakukan M; jika tidak, lakukan N; lalu lakukan Y...), pertimbangkan untuk memecah tugas dan biarkan setiap panggilan Gemini Nano menangani tugas yang lebih terfokus, sambil menggunakan kode untuk menggabungkan beberapa panggilan.

  • Gunakan nilai suhu yang lebih rendah untuk tugas deterministik. Untuk tugas seperti ekstraksi atau terjemahan entitas yang tidak bergantung pada kreativitas, sebaiknya mulai dengan nilai temperature sebesar 0.2, dan sesuaikan nilai ini berdasarkan pengujian Anda.