En esta página, se incluyen recomendaciones para proporcionar datos de voz a la API de Asistente de Google. Estos lineamientos se diseñaron para aumentar la eficiencia y la exactitud, además de obtener tiempos de respuesta razonables del servicio.
Preprocesamiento de audio
Lo ideal es proporcionar un audio lo más limpio posible mediante un micrófono de buena calidad y correctamente ubicado. Sin embargo, la aplicación del procesamiento de la señal de reducción de ruidos al audio antes de enviarlo al servicio generalmente reduce la exactitud del reconocimiento. El servicio está diseñado para manejar audio ruidoso.
Para lograr resultados óptimos, haz lo siguiente:
Coloca el micrófono lo más cerca posible del usuario, en especial cuando hay ruido de fondo.
Evita el recorte de audio.
No uses el control automático de ganancia (AGC).
Todo el procesamiento de reducción de ruidos debe estar inhabilitado.
Idealmente, sigue estos pasos:
El nivel de audio debe calibrarse para que la señal de entrada no se recorte y los niveles máximos de audio de voz alcancen aproximadamente de -20 a -10 dBFS.
El dispositivo debe exhibir una amplitud "plana" frente a características de frecuencia (+- 3 dB, 100 Hz a 8,000 Hz).
La distorsión armónica total debe ser inferior al 1%, entre 100 Hz y 8,000 Hz, a un nivel de entrada de SPL de 90 dB.
[null,null,["Última actualización: 2023-12-02 (UTC)"],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]