طراحی سریع برای Gemini Nano

هنگام استفاده از Prompt API، استراتژی‌های خاصی وجود دارد که می‌توانید برای سفارشی‌سازی اعلان‌های خود و دریافت نتایج بهینه از آنها استفاده کنید. این صفحه بهترین شیوه‌ها برای قالب‌بندی اعلان‌ها برای Gemini Nano را شرح می‌دهد.

برای راهنمایی‌های کلی‌تر در مورد مهندسی سریع، به گزارش رسمی مهندسی سریع ، مهندسی سریع برای هوش مصنوعی مولد و استراتژی‌های طراحی سریع مراجعه کنید.

از طرف دیگر، برای اصلاح و بهبود خودکار اعلان‌ها، می‌توانید از بهینه‌ساز zero-shot استفاده کنید که می‌تواند مدل‌های روی دستگاه مانند gemma-3n-e4b-it را هدف قرار دهد.

بهترین شیوه‌های طراحی سریع

هنگام طراحی اعلان‌ها برای Prompt API، از تکنیک‌های زیر استفاده کنید:

  • مثال‌هایی برای یادگیری در متن ارائه دهید . مثال‌های با توزیع مناسب را به سوال خود اضافه کنید تا به Gemini Nano نوع نتیجه‌ای را که انتظار دارید نشان دهید.

    هنگام استفاده از یادگیری درون متنی، استفاده از ویژگی ذخیره‌سازی پیشوند را در نظر بگیرید، زیرا ارائه مثال‌ها باعث طولانی‌تر شدن اعلان و افزایش زمان استنتاج می‌شود.

  • مختصر و مفید باشید . مقدمه‌های طولانی با دستورالعمل‌های تکراری می‌تواند نتایج نامطلوبی به بار آورد. درخواست خود را متمرکز و دقیق نگه دارید.

  • برای ایجاد پاسخ‌های مؤثرتر، به سؤالات ساختار دهید ، مانند این الگوی نمونه که به وضوح دستورالعمل‌ها، محدودیت‌ها و مثال‌ها را تعریف می‌کند.

  • خروجی را کوتاه نگه دارید . سرعت استنتاج LLM به شدت به طول خروجی وابسته است. با دقت در نظر بگیرید که چگونه می‌توانید کوتاه‌ترین خروجی ممکن را برای مورد استفاده خود تولید کنید و پس‌پردازش دستی را برای ساختاردهی خروجی در قالب دلخواه انجام دهید.

  • جداکننده‌ها را اضافه کنید . از جداکننده‌هایی مانند <background_information> ، <instruction> و ## برای ایجاد جدایی بین بخش‌های مختلف اعلان خود استفاده کنید. استفاده از ## بین اجزا به ویژه برای Gemini Nano بسیار مهم است، زیرا احتمال عدم موفقیت مدل در تفسیر صحیح هر جزء را به میزان قابل توجهی کاهش می‌دهد.

  • منطق ساده و یک کار متمرکزتر را ترجیح دهید . اگر دستیابی به نتایج خوب با یک دستور که نیاز به استدلال چند مرحله‌ای دارد (مثلاً ابتدا X را انجام دهید، اگر نتیجه X A است، M را انجام دهید؛ در غیر این صورت N را انجام دهید؛ سپس Y را انجام دهید... ) را چالش برانگیز می‌دانید، تقسیم کار را در نظر بگیرید و اجازه دهید هر فراخوانی Gemini Nano یک کار متمرکزتر را انجام دهد، در حالی که از کد برای اتصال چندین فراخوانی به یکدیگر استفاده می‌کنید.

  • برای وظایف قطعی از مقادیر دمای پایین‌تر استفاده کنید . برای وظایفی مانند استخراج موجودیت یا ترجمه که به خلاقیت متکی نیستند، با مقدار temperature 0.2 شروع کنید و این مقدار را بر اساس آزمایش خود تنظیم کنید.