Projektowanie promptów dla Gemini Nano

Podczas korzystania z interfejsu Prompt API możesz stosować określone strategie, aby dostosowywać prompty i uzyskiwać optymalne wyniki. Na tej stronie opisujemy sprawdzone metody formatowania promptów dla Gemini Nano.

Ogólne wskazówki dotyczące tworzenia promptów znajdziesz w artykule na temat tworzenia promptów, tworzenia promptów dla generatywnej AIstrategii projektowania promptów.

Aby automatycznie ulepszać prompty, możesz też użyć optymalizatora zero-shot, który może kierować reklamy na modele na urządzeniu, takie jak gemma-3n-e4b-it.

Sprawdzone metody projektowania promptów

Podczas projektowania promptów dla interfejsu Prompt API stosuj te techniki:

  • Podawanie przykładów w kontekście Dodaj do promptu dobrze rozłożone przykłady, aby pokazać Gemini Nano, jakiego rodzaju wyniku oczekujesz.

    Jeśli korzystasz z uczenia w kontekście, rozważ użycie funkcji buforowania prefiksów, ponieważ podawanie przykładów wydłuża prompt i zwiększa czas wnioskowania.

  • Zadbaj o zwięzłość. Długie wstępy z powtarzającymi się instrukcjami mogą dawać niezadowalające wyniki. Prompt powinien być zwięzły i konkretny.

  • Twórz prompty o określonej strukturze, aby generować skuteczniejsze odpowiedzi, np. ten przykładowy szablon promptu, który jasno określa instrukcje, ograniczenia i przykłady.

  • Zachowaj zwięzłość. Szybkość wnioskowania LLM w dużym stopniu zależy od długości danych wyjściowych. Zastanów się, jak wygenerować jak najkrótsze dane wyjściowe na potrzeby Twojego przypadku użycia, i ręcznie je przetwórz, aby nadać im odpowiedni format.

  • Dodaj ograniczniki. Używaj separatorów, takich jak <background_information>,<instruction>##, aby oddzielić różne części promptu. Używanie ## między komponentami jest szczególnie ważne w przypadku Gemini Nano, ponieważ znacznie zmniejsza prawdopodobieństwo, że model nieprawidłowo zinterpretuje poszczególne komponenty.

  • Preferuj prostą logikę i bardziej skoncentrowane zadanie. Jeśli trudno Ci uzyskać dobre wyniki za pomocą prompta wymagającego wieloetapowego rozumowania (np. najpierw zrób X, jeśli wynikiem X jest A, zrób M; w przeciwnym razie zrób N; potem zrób Y…), rozbij zadanie na mniejsze części i pozwól, aby każde wywołanie Gemini Nano obsługiwało bardziej szczegółowe zadanie, a następnie użyj kodu, aby połączyć ze sobą wiele wywołań.

  • W przypadku zadań deterministycznych używaj niższych wartości temperatury. W przypadku zadań takich jak wyodrębnianie jednostek lub tłumaczenie, które nie wymagają kreatywności, rozważ rozpoczęcie od wartości temperature równej 0.2 i dostosuj ją na podstawie testów.