Cuando usas la API de Prompt, hay estrategias específicas que puedes usar para adaptar tus instrucciones y recibir resultados óptimos. En esta página, se describen las prácticas recomendadas para dar formato a las instrucciones de Gemini Nano.
Para obtener más orientación general sobre la ingeniería de instrucciones, consulta el informe técnico sobre la ingeniería de instrucciones, la ingeniería de instrucciones para la IA generativa y las estrategias de diseño de instrucciones.
Como alternativa, para refinar y mejorar automáticamente las instrucciones, puedes usar el optimizador de aprendizaje sin ejemplos, que puede segmentar modelos integrados en el dispositivo, como gemma-3n-e4b-it.
Prácticas recomendadas para el diseño de instrucciones
Cuando diseñes instrucciones para la API de Prompt, usa las siguientes técnicas:
Proporciona ejemplos para el aprendizaje en contexto. Agrega ejemplos bien distribuidos a tu instrucción para mostrarle a Gemini Nano el tipo de resultado que esperas.
Considera usar la función de almacenamiento en caché de prefijos cuando uses el aprendizaje en contexto, ya que proporcionar ejemplos hace que la instrucción sea más larga y aumenta el tiempo de inferencia.
Sé breve. Los preámbulos detallados con instrucciones repetidas pueden producir resultados deficientes. Mantén tu instrucción enfocada y directa.
Estructura las instrucciones para generar respuestas más eficaces, como esta plantilla de instrucción de ejemplo que define claramente las instrucciones, las restricciones y los ejemplos.
Mantén la respuesta breve. Las velocidades de inferencia de los LLM dependen en gran medida de la longitud de la salida. Considera cuidadosamente cómo puedes generar el resultado más corto posible para tu caso de uso y realiza un procesamiento posterior manual para estructurar el resultado en el formato deseado.
Agregar delimitadores Usa delimitadores como
<background_information>,<instruction>y##para separar las diferentes partes de tu instrucción. Usar##entre los componentes es especialmente importante para Gemini Nano, ya que reduce significativamente las probabilidades de que el modelo no interprete correctamente cada componente.Prefiere la lógica simple y una tarea más enfocada. Si te resulta difícil obtener buenos resultados con una instrucción que requiere un razonamiento de varios pasos (por ejemplo, primero haz X; si el resultado de X es A, haz M; de lo contrario, haz N; luego haz Y…), considera dividir la tarea y dejar que cada llamada a Gemini Nano controle una tarea más enfocada, mientras usas código para encadenar varias llamadas.
Usa valores de temperatura más bajos para las tareas determinísticas. Para tareas como la extracción de entidades o la traducción que no dependen de la creatividad, considera comenzar con un valor de
temperaturede0.2y ajusta este valor según tus pruebas.