Wenn Sie die Prompt API verwenden, können Sie bestimmte Strategien anwenden, um Ihre Prompts anzupassen und optimale Ergebnisse zu erzielen. Auf dieser Seite werden Best Practices für das Formatieren von Prompts für Gemini Nano beschrieben.
Allgemeinere Anleitungen zum Prompt Engineering finden Sie im Whitepaper zu Prompt Engineering, unter Prompt Engineering für generative KI und unter Strategien für das Prompt-Design.
Alternativ können Sie den Zero-Shot-Optimizer verwenden, um Prompts automatisch zu optimieren und zu verbessern. Dieser kann auf On-Device-Modelle wie gemma-3n-e4b-it ausgerichtet werden.
Prompt-Design – Best Practices
Verwenden Sie beim Erstellen von Prompts für die Prompt API die folgenden Techniken:
Beispiele für das In-Context-Lernen angeben: Fügen Sie Ihrem Prompt gut verteilte Beispiele hinzu, um Gemini Nano zu zeigen, welche Art von Ergebnis Sie erwarten.
Wenn Sie In-Context Learning verwenden, sollten Sie die Funktion Präfix-Caching in Betracht ziehen, da Beispiele den Prompt verlängern und die Inferenzzeit verlängern.
Fassen Sie sich kurz. Ausführliche Präambeln mit wiederholten Anweisungen können zu suboptimalen Ergebnissen führen. Halten Sie Ihren Prompt fokussiert und prägnant.
Prompts strukturieren, um effektivere Antworten zu generieren, z. B. mit dieser Beispiel-Promptvorlage, in der Anweisungen, Einschränkungen und Beispiele klar definiert sind.
Halten Sie die Ausgabe kurz. Die Inferenzgeschwindigkeiten von LLMs hängen stark von der Ausgabelänge ab. Überlegen Sie genau, wie Sie die kürzestmögliche Ausgabe für Ihren Anwendungsfall generieren können, und führen Sie eine manuelle Nachbearbeitung durch, um die Ausgabe im gewünschten Format zu strukturieren.
Trennzeichen hinzufügen Verwenden Sie Trennzeichen wie
<background_information>,<instruction>und##, um verschiedene Teile Ihres Prompts voneinander zu trennen. Die Verwendung von##zwischen Komponenten ist besonders wichtig für Gemini Nano, da sie die Wahrscheinlichkeit deutlich verringert, dass das Modell jede Komponente nicht richtig interpretiert.Einfache Logik und eine fokussiertere Aufgabe bevorzugen: Wenn Sie mit einem Prompt, der mehrstufige Überlegungen erfordert (z. B. Zuerst X ausführen. Wenn das Ergebnis von X gleich A ist, M ausführen, andernfalls N ausführen. Dann Y ausführen...), nur schwer gute Ergebnisse erzielen, sollten Sie die Aufgabe aufteilen und jede Gemini Nano-Anfrage eine fokussiertere Aufgabe erledigen lassen. Verwenden Sie Code, um mehrere Anfragen zu verketten.
Niedrigere Temperaturwerte für deterministische Aufgaben verwenden: Bei Aufgaben wie der Extraktion von Einheiten oder der Übersetzung, die nicht auf Kreativität beruhen, sollten Sie mit einem
temperature-Wert von0.2beginnen und diesen Wert basierend auf Ihren Tests anpassen.