При использовании Prompt API существуют специальные стратегии, позволяющие настроить запросы и получить оптимальные результаты. На этой странице описаны рекомендации по форматированию запросов для Gemini Nano.
Более общие рекомендации по оперативной инженерии см. в технической документации по оперативной инженерии , в руководстве по оперативной инженерии для генеративного ИИ и в руководстве по стратегиям оперативной инженерии .
В качестве альтернативы, для автоматического улучшения и уточнения подсказок вы можете использовать оптимизатор Zero-Shot , который может работать с моделями устройств, такими как gemma-3n-e4b-it .
Лучшие практики оперативного проектирования
При разработке подсказок для Prompt API используйте следующие приемы:
Приведите примеры для контекстного обучения . Добавьте к заданию примеры, которые будут хорошо распределены, чтобы показать Gemini Nano, какой результат вы ожидаете.
Рассмотрите возможность использования функции кэширования префиксов при использовании контекстного обучения, поскольку предоставление примеров удлиняет подсказку и увеличивает время вывода.
Будьте лаконичны . Длинные преамбулы с повторяющимися инструкциями могут привести к неоптимальным результатам. Пусть ваши предложения будут конкретными и по существу.
Структурируйте подсказки для получения более эффективных ответов, как, например, этот пример шаблона подсказки , в котором четко определены инструкции, ограничения и примеры.
Вывод должен быть коротким . Скорость вывода LLM сильно зависит от длины вывода. Тщательно продумайте, как сгенерировать максимально короткий вывод для вашего варианта использования, и выполните ручную постобработку, чтобы структурировать вывод в желаемом формате.
Добавьте разделители . Используйте такие разделители, как
<background_information>,<instruction>и##, для разделения различных частей подсказки. Использование##между компонентами особенно важно для Gemini Nano, поскольку это значительно снижает вероятность того, что модель не сможет правильно интерпретировать каждый компонент.Предпочитайте простую логику и более конкретную задачу . Если вам сложно добиться хороших результатов, выполняя подсказку, требующую многошагового рассуждения (например, сначала выполните X, если результат X — A, выполните M; в противном случае выполните N; затем выполните Y... ), попробуйте разбить задачу на части и позволить каждому вызову Gemini Nano выполнять более конкретную задачу, используя код для объединения нескольких вызовов в цепочку.
Для детерминированных задач используйте более низкие значения температуры . Для таких задач, как извлечение сущностей или перевод, не требующих творческого подхода, попробуйте начать со значения
temperature0.2и корректировать его на основе результатов тестирования.