Эта страница переведена с помощью Cloud Translation API.

Быстрый дизайн для Gemini Nano

При использовании Prompt API существуют специальные стратегии, позволяющие настроить запросы и получить оптимальные результаты. На этой странице описаны рекомендации по форматированию запросов для Gemini Nano.

В качестве альтернативы, для автоматического улучшения и уточнения подсказок вы можете использовать оптимизатор Zero-Shot , который может работать с моделями устройств, такими как gemma-3n-e4b-it .

Лучшие практики оперативного проектирования

При разработке подсказок для Prompt API используйте следующие приемы:

Приведите примеры для контекстного обучения . Добавьте к заданию примеры, которые будут хорошо распределены, чтобы показать Gemini Nano, какой результат вы ожидаете.
Рассмотрите возможность использования функции кэширования префиксов при использовании контекстного обучения, поскольку предоставление примеров удлиняет подсказку и увеличивает время вывода.
Будьте лаконичны . Длинные преамбулы с повторяющимися инструкциями могут привести к неоптимальным результатам. Пусть ваши предложения будут конкретными и по существу.
Структурируйте подсказки для получения более эффективных ответов, как, например, этот пример шаблона подсказки , в котором четко определены инструкции, ограничения и примеры.
Вывод должен быть коротким . Скорость вывода LLM сильно зависит от длины вывода. Тщательно продумайте, как сгенерировать максимально короткий вывод для вашего варианта использования, и выполните ручную постобработку, чтобы структурировать вывод в желаемом формате.
Добавьте разделители . Используйте такие разделители, как <background_information> , <instruction> и ## , для разделения различных частей подсказки. Использование ## между компонентами особенно важно для Gemini Nano, поскольку это значительно снижает вероятность того, что модель не сможет правильно интерпретировать каждый компонент.
Предпочитайте простую логику и более конкретную задачу . Если вам сложно добиться хороших результатов, выполняя подсказку, требующую многошагового рассуждения (например, сначала выполните X, если результат X — A, выполните M; в противном случае выполните N; затем выполните Y... ), попробуйте разбить задачу на части и позволить каждому вызову Gemini Nano выполнять более конкретную задачу, используя код для объединения нескольких вызовов в цепочку.
Для детерминированных задач используйте более низкие значения температуры . Для таких задач, как извлечение сущностей или перевод, не требующих творческого подхода, попробуйте начать со значения temperature 0.2 и корректировать его на основе результатов тестирования.

Быстрый дизайн для Gemini Nano Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

Лучшие практики оперативного проектирования

Быстрый дизайн для Gemini Nano