Ao usar a API Prompt, há estratégias específicas que você pode usar para adaptar seus comandos e receber resultados ideais. Esta página descreve as práticas recomendadas para formatação de comandos para o Gemini Nano.
Para orientações mais gerais sobre engenharia de comando, consulte o white paper sobre engenharia de comando, engenharia de comando para IA generativa e estratégias de design de comandos.
Como alternativa, para refinar e melhorar automaticamente os comandos, use o
otimizador de aprendizado sem exemplos, que pode segmentar modelos no dispositivo, como
gemma-3n-e4b-it.
Práticas recomendadas para o design de comandos
Ao criar comandos para a API Prompt, use as seguintes técnicas:
Forneça exemplos para o aprendizado em contexto. Adicione exemplos bem distribuídos ao comando para mostrar ao Gemini Nano o tipo de resultado que você espera.
Considere usar o recurso de armazenamento em cache de prefixo ao usar o aprendizado no contexto, já que fornecer exemplos aumenta o tempo de inferência e o tamanho do comando.
Use um texto conciso. Preâmbulos longos com instruções repetidas podem produzir resultados abaixo do ideal. Mantenha o comando focado e direto.
Estruture os comandos para gerar respostas mais eficazes, como este modelo de comando de exemplo que define claramente instruções, restrições e exemplos.
Mantenha a saída curta. As velocidades de inferência do LLM dependem muito do comprimento da saída. Considere cuidadosamente como gerar a saída mais curta possível para seu caso de uso e faça pós-processamento manual para estruturar a saída no formato desejado.
Adicionar delimitadores. Use delimitadores como
<background_information>,<instruction>e##para separar as diferentes partes do comando. Usar##entre componentes é especialmente importante para o Gemini Nano, porque reduz significativamente as chances de o modelo não interpretar corretamente cada componente.Prefira uma lógica simples e uma tarefa mais focada. Se você tiver dificuldade em conseguir bons resultados com um comando que exige raciocínio de várias etapas (por exemplo, primeiro faça X, se o resultado de X for A, faça M; caso contrário, faça N; depois faça Y...), divida a tarefa e deixe cada chamada do Gemini Nano lidar com uma tarefa mais focada, usando código para encadear várias chamadas.
Use valores de temperatura mais baixos para tarefas determinísticas. Para tarefas como extração de entidades ou tradução que não dependem da criatividade, considere começar com um valor
temperaturede0.2e ajuste esse valor com base nos seus testes.