Cette page contient des recommandations sur la manière de fournir des données vocales à l'API Assistant Google. Ces instructions visent à améliorer l'efficacité et la précision du service, ainsi qu'à obtenir des temps de réponse raisonnables.
Prétraitement du contenu audio
Il est préférable de fournir un contenu audio aussi propre que possible en utilisant un micro de bonne qualité et bien positionné. Cependant, le fait d'appliquer un traitement de signal de réduction de bruit au contenu audio avant de l'envoyer au service réduit généralement la précision de la reconnaissance. Le service est en effet conçu pour gérer les contenus audio bruyants.
Pour des résultats optimaux, procédez comme suit :
Placez le micro le plus près possible de l'utilisateur, en particulier en cas de bruit de fond.
Évitez les découpages audio.
N'utilisez pas le contrôle automatique du gain (CAG).
Tout traitement de réduction du bruit doit être désactivé.
Dans l'idéal:
Le niveau audio doit être calibré de sorte que le signal d'entrée ne soit pas coupé et que les niveaux audio de voix maximales atteignent environ -20 à -10 dBFS.
L'appareil doit présenter des caractéristiques d'amplitude par rapport à la fréquence approximativement "plates" (+- 3 dB de 100 Hz à 8 000 Hz).
La distorsion harmonique totale doit être inférieure à 1% entre 100 et 8 000 Hz à un niveau d'entrée de 90 dB SPL.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2023/12/02 (UTC).
[null,null,["Dernière mise à jour le 2023/12/02 (UTC)."],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]