Podczas korzystania z interfejsu Prompt API możesz stosować określone strategie, aby dostosowywać prompty i uzyskiwać optymalne wyniki. Na tej stronie opisujemy sprawdzone metody formatowania promptów dla Gemini Nano.
Ogólne wskazówki dotyczące tworzenia promptów znajdziesz w artykule na temat tworzenia promptów, tworzenia promptów dla generatywnej AI i strategii projektowania promptów.
Aby automatycznie ulepszać prompty, możesz też użyć optymalizatora zero-shot, który może kierować reklamy na modele na urządzeniu, takie jak gemma-3n-e4b-it.
Sprawdzone metody projektowania promptów
Podczas projektowania promptów dla interfejsu Prompt API stosuj te techniki:
Podawanie przykładów w kontekście Dodaj do promptu dobrze rozłożone przykłady, aby pokazać Gemini Nano, jakiego rodzaju wyniku oczekujesz.
Jeśli korzystasz z uczenia w kontekście, rozważ użycie funkcji buforowania prefiksów, ponieważ podawanie przykładów wydłuża prompt i zwiększa czas wnioskowania.
Zadbaj o zwięzłość. Długie wstępy z powtarzającymi się instrukcjami mogą dawać niezadowalające wyniki. Prompt powinien być zwięzły i konkretny.
Twórz prompty o określonej strukturze, aby generować skuteczniejsze odpowiedzi, np. ten przykładowy szablon promptu, który jasno określa instrukcje, ograniczenia i przykłady.
Zachowaj zwięzłość. Szybkość wnioskowania LLM w dużym stopniu zależy od długości danych wyjściowych. Zastanów się, jak wygenerować jak najkrótsze dane wyjściowe na potrzeby Twojego przypadku użycia, i ręcznie je przetwórz, aby nadać im odpowiedni format.
Dodaj ograniczniki. Używaj separatorów, takich jak
<background_information>,<instruction>i##, aby oddzielić różne części promptu. Używanie##między komponentami jest szczególnie ważne w przypadku Gemini Nano, ponieważ znacznie zmniejsza prawdopodobieństwo, że model nieprawidłowo zinterpretuje poszczególne komponenty.Preferuj prostą logikę i bardziej skoncentrowane zadanie. Jeśli trudno Ci uzyskać dobre wyniki za pomocą prompta wymagającego wieloetapowego rozumowania (np. najpierw zrób X, jeśli wynikiem X jest A, zrób M; w przeciwnym razie zrób N; potem zrób Y…), rozbij zadanie na mniejsze części i pozwól, aby każde wywołanie Gemini Nano obsługiwało bardziej szczegółowe zadanie, a następnie użyj kodu, aby połączyć ze sobą wiele wywołań.
W przypadku zadań deterministycznych używaj niższych wartości temperatury. W przypadku zadań takich jak wyodrębnianie jednostek lub tłumaczenie, które nie wymagają kreatywności, rozważ rozpoczęcie od wartości
temperaturerównej0.2i dostosuj ją na podstawie testów.