هنگام استفاده از Prompt API، استراتژیهای خاصی وجود دارد که میتوانید برای سفارشیسازی اعلانهای خود و دریافت نتایج بهینه از آنها استفاده کنید. این صفحه بهترین شیوهها برای قالببندی اعلانها برای Gemini Nano را شرح میدهد.
برای راهنماییهای کلیتر در مورد مهندسی سریع، به گزارش رسمی مهندسی سریع ، مهندسی سریع برای هوش مصنوعی مولد و استراتژیهای طراحی سریع مراجعه کنید.
از طرف دیگر، برای اصلاح و بهبود خودکار اعلانها، میتوانید از بهینهساز zero-shot استفاده کنید که میتواند مدلهای روی دستگاه مانند gemma-3n-e4b-it را هدف قرار دهد.
بهترین شیوههای طراحی سریع
هنگام طراحی اعلانها برای Prompt API، از تکنیکهای زیر استفاده کنید:
مثالهایی برای یادگیری در متن ارائه دهید . مثالهای با توزیع مناسب را به سوال خود اضافه کنید تا به Gemini Nano نوع نتیجهای را که انتظار دارید نشان دهید.
هنگام استفاده از یادگیری درون متنی، استفاده از ویژگی ذخیرهسازی پیشوند را در نظر بگیرید، زیرا ارائه مثالها باعث طولانیتر شدن اعلان و افزایش زمان استنتاج میشود.
مختصر و مفید باشید . مقدمههای طولانی با دستورالعملهای تکراری میتواند نتایج نامطلوبی به بار آورد. درخواست خود را متمرکز و دقیق نگه دارید.
برای ایجاد پاسخهای مؤثرتر، به سؤالات ساختار دهید ، مانند این الگوی نمونه که به وضوح دستورالعملها، محدودیتها و مثالها را تعریف میکند.
خروجی را کوتاه نگه دارید . سرعت استنتاج LLM به شدت به طول خروجی وابسته است. با دقت در نظر بگیرید که چگونه میتوانید کوتاهترین خروجی ممکن را برای مورد استفاده خود تولید کنید و پسپردازش دستی را برای ساختاردهی خروجی در قالب دلخواه انجام دهید.
جداکنندهها را اضافه کنید . از جداکنندههایی مانند
<background_information>،<instruction>و##برای ایجاد جدایی بین بخشهای مختلف اعلان خود استفاده کنید. استفاده از##بین اجزا به ویژه برای Gemini Nano بسیار مهم است، زیرا احتمال عدم موفقیت مدل در تفسیر صحیح هر جزء را به میزان قابل توجهی کاهش میدهد.منطق ساده و یک کار متمرکزتر را ترجیح دهید . اگر دستیابی به نتایج خوب با یک دستور که نیاز به استدلال چند مرحلهای دارد (مثلاً ابتدا X را انجام دهید، اگر نتیجه X A است، M را انجام دهید؛ در غیر این صورت N را انجام دهید؛ سپس Y را انجام دهید... ) را چالش برانگیز میدانید، تقسیم کار را در نظر بگیرید و اجازه دهید هر فراخوانی Gemini Nano یک کار متمرکزتر را انجام دهد، در حالی که از کد برای اتصال چندین فراخوانی به یکدیگر استفاده میکنید.
برای وظایف قطعی از مقادیر دمای پایینتر استفاده کنید . برای وظایفی مانند استخراج موجودیت یا ترجمه که به خلاقیت متکی نیستند، با مقدار
temperature0.2شروع کنید و این مقدار را بر اساس آزمایش خود تنظیم کنید.