Criação de comandos para o Gemini Nano

Ao usar a API Prompt, há estratégias específicas que você pode usar para adaptar seus comandos e receber resultados ideais. Esta página descreve as práticas recomendadas para formatação de comandos para o Gemini Nano.

Para orientações mais gerais sobre engenharia de comando, consulte o white paper sobre engenharia de comando, engenharia de comando para IA generativa e estratégias de design de comandos.

Como alternativa, para refinar e melhorar automaticamente os comandos, use o otimizador de aprendizado sem exemplos, que pode segmentar modelos no dispositivo, como gemma-3n-e4b-it.

Práticas recomendadas para o design de comandos

Ao criar comandos para a API Prompt, use as seguintes técnicas:

  • Forneça exemplos para o aprendizado em contexto. Adicione exemplos bem distribuídos ao comando para mostrar ao Gemini Nano o tipo de resultado que você espera.

    Considere usar o recurso de armazenamento em cache de prefixo ao usar o aprendizado no contexto, já que fornecer exemplos aumenta o tempo de inferência e o tamanho do comando.

  • Use um texto conciso. Preâmbulos longos com instruções repetidas podem produzir resultados abaixo do ideal. Mantenha o comando focado e direto.

  • Estruture os comandos para gerar respostas mais eficazes, como este modelo de comando de exemplo que define claramente instruções, restrições e exemplos.

  • Mantenha a saída curta. As velocidades de inferência do LLM dependem muito do comprimento da saída. Considere cuidadosamente como gerar a saída mais curta possível para seu caso de uso e faça pós-processamento manual para estruturar a saída no formato desejado.

  • Adicionar delimitadores. Use delimitadores como <background_information>, <instruction> e ## para separar as diferentes partes do comando. Usar ## entre componentes é especialmente importante para o Gemini Nano, porque reduz significativamente as chances de o modelo não interpretar corretamente cada componente.

  • Prefira uma lógica simples e uma tarefa mais focada. Se você tiver dificuldade em conseguir bons resultados com um comando que exige raciocínio de várias etapas (por exemplo, primeiro faça X, se o resultado de X for A, faça M; caso contrário, faça N; depois faça Y...), divida a tarefa e deixe cada chamada do Gemini Nano lidar com uma tarefa mais focada, usando código para encadear várias chamadas.

  • Use valores de temperatura mais baixos para tarefas determinísticas. Para tarefas como extração de entidades ou tradução que não dependem da criatividade, considere começar com um valor temperature de 0.2 e ajuste esse valor com base nos seus testes.