Esta página contém recomendações sobre como fornecer dados de voz à
API Google Assistente. Essas diretrizes foram criadas para aumentar a eficiência e a precisão,
bem como os tempos de resposta razoáveis do serviço.
Pré-processamento de áudio
É melhor fornecer áudio que seja o mais limpo possível, usando um microfone de boa qualidade e bem posicionado. No entanto, aplicar ao áudio um processamento de sinal de redução de ruídos antes de enviá-lo ao serviço geralmente reduz a precisão do reconhecimento. O serviço foi projetado para lidar com áudios com ruídos.
Para os melhores resultados:
Posicione o microfone o mais próximo possível do usuário, principalmente quando
houver ruído de fundo.
evite recortar o áudio;
não use controle de ganho automático (AGC);
todo o processamento de redução de ruído deve ser desativado.
Idealmente:
O nível de áudio precisa ser calibrado para que o sinal de entrada não seja cortado e os níveis de pico de áudio de fala atinjam aproximadamente -20 a -10 dBFS.
O dispositivo precisa exibir características de amplitude versus
frequência aproximadas (+- 3 dB 100 Hz a 8.000 Hz).
A distorção harmônica total precisa ser inferior a 1% de 100 Hz a 8.000
Hz com um nível de entrada de SPL de 90 dB.
[null,null,["Última atualização 2023-12-02 UTC."],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]