Quando utilizzi l'API Prompt, puoi utilizzare strategie specifiche per personalizzare i prompt e ottenere risultati ottimali. Questa pagina descrive le best practice per la formattazione dei prompt per Gemini Nano.
Per indicazioni più generali sull'ingegneria dei prompt, consulta il white paper sull'ingegneria dei prompt, l'articolo Ingegneria dei prompt per l'AI generativa e le strategie di progettazione dei prompt.
In alternativa, per perfezionare e migliorare automaticamente i prompt, puoi utilizzare
l'ottimizzatore zero-shot, che può scegliere come target i modelli on-device come
gemma-3n-e4b-it.
Best practice per la progettazione dei prompt
Quando progetti prompt per l'API Prompt, utilizza le seguenti tecniche:
Fornisci esempi per l'apprendimento contestuale. Aggiungi esempi ben distribuiti al tuo prompt per mostrare a Gemini Nano il tipo di risultato che ti aspetti.
Valuta la possibilità di utilizzare la funzionalità di memorizzazione nella cache dei prefissi quando utilizzi l'apprendimento in-context, in quanto la fornitura di esempi rende il prompt più lungo e aumenta il tempo di inferenza.
Sii conciso. Preamboli prolissi con istruzioni ripetute possono produrre risultati non ottimali. Mantieni il prompt mirato e conciso.
Struttura i prompt per generare risposte più efficaci, ad esempio questo template di prompt di esempio che definisce chiaramente istruzioni, vincoli ed esempi.
Mantieni l'output breve. Le velocità di inferenza degli LLM dipendono molto dalla lunghezza dell'output. Valuta attentamente come generare l'output più breve possibile per il tuo caso d'uso ed esegui la post-elaborazione manuale per strutturare l'output nel formato desiderato.
Aggiungi delimitatori. Utilizza delimitatori come
<background_information>,<instruction>e##per creare una separazione tra le diverse parti del prompt. L'utilizzo di##tra i componenti è particolarmente importante per Gemini Nano, in quanto riduce notevolmente le probabilità che il modello non interpreti correttamente ogni componente.Preferisci una logica semplice e un'attività più mirata. Se hai difficoltà a ottenere buoni risultati con un prompt che richiede un ragionamento in più passaggi (ad esempio, fai prima X, se il risultato di X è A, fai M; altrimenti fai N; poi fai Y...), valuta la possibilità di suddividere l'attività e lasciare che ogni chiamata a Gemini Nano gestisca un'attività più mirata, utilizzando il codice per concatenare più chiamate.
Utilizza valori di temperatura più bassi per le attività deterministiche. Per attività come l'estrazione di entità o la traduzione che non si basano sulla creatività, valuta la possibilità di iniziare con un valore
temperaturedi0.2e di perfezionarlo in base ai test.