Быстрый дизайн для Gemini Nano

При использовании Prompt API существуют специальные стратегии, позволяющие настроить запросы и получить оптимальные результаты. На этой странице описаны рекомендации по форматированию запросов для Gemini Nano.

Более общие рекомендации по оперативной инженерии см. в технической документации по оперативной инженерии , в руководстве по оперативной инженерии для генеративного ИИ и в руководстве по стратегиям оперативной инженерии .

В качестве альтернативы, для автоматического улучшения и уточнения подсказок вы можете использовать оптимизатор Zero-Shot , который может работать с моделями устройств, такими как gemma-3n-e4b-it .

Лучшие практики оперативного проектирования

При разработке подсказок для Prompt API используйте следующие приемы:

  • Приведите примеры для контекстного обучения . Добавьте к заданию примеры, которые будут хорошо распределены, чтобы показать Gemini Nano, какой результат вы ожидаете.

    Рассмотрите возможность использования функции кэширования префиксов при использовании контекстного обучения, поскольку предоставление примеров удлиняет подсказку и увеличивает время вывода.

  • Будьте лаконичны . Длинные преамбулы с повторяющимися инструкциями могут привести к неоптимальным результатам. Пусть ваши предложения будут конкретными и по существу.

  • Структурируйте подсказки для получения более эффективных ответов, как, например, этот пример шаблона подсказки , в котором четко определены инструкции, ограничения и примеры.

  • Вывод должен быть коротким . Скорость вывода LLM сильно зависит от длины вывода. Тщательно продумайте, как сгенерировать максимально короткий вывод для вашего варианта использования, и выполните ручную постобработку, чтобы структурировать вывод в желаемом формате.

  • Добавьте разделители . Используйте такие разделители, как <background_information> , <instruction> и ## , для разделения различных частей подсказки. Использование ## между компонентами особенно важно для Gemini Nano, поскольку это значительно снижает вероятность того, что модель не сможет правильно интерпретировать каждый компонент.

  • Предпочитайте простую логику и более конкретную задачу . Если вам сложно добиться хороших результатов, выполняя подсказку, требующую многошагового рассуждения (например, сначала выполните X, если результат X — A, выполните M; в противном случае выполните N; затем выполните Y... ), попробуйте разбить задачу на части и позволить каждому вызову Gemini Nano выполнять более конкретную задачу, используя код для объединения нескольких вызовов в цепочку.

  • Для детерминированных задач используйте более низкие значения температуры . Для таких задач, как извлечение сущностей или перевод, не требующих творческого подхода, попробуйте начать со значения temperature 0.2 и корректировать его на основе результатов тестирования.