בדף הזה מוסבר איך לספק נתוני דיבור ל-Google Assistant API. ההנחיות האלה נועדו לשפר את היעילות והדיוק, וכן לספק זמני תגובה סבירים מהשירות.
עיבוד מראש של האודיו
עדיף לספק אודיו נקי ככל האפשר על ידי שימוש במיקרופון באיכות טובה ובמיקום טוב. עם זאת, הפעלת עיבוד אותות של הפחתת רעש על האודיו לפני שליחתו לשירות בדרך כלל מפחיתה את רמת הדיוק של הזיהוי. השירות מיועד לטפל באודיו עם רעש.
לקבלת התוצאות הטובות ביותר:
מקם את המיקרופון קרוב ככל האפשר למשתמש, במיוחד כשיש רעשי רקע.
יש להימנע מחיתוך אודיו.
אין להשתמש בבקרה אוטומטית על השגת יעדים (AGC).
צריך להשבית את כל עיבודי הפחתת הרעש.
באופן אידאלי:
צריך לכייל את עוצמת הקול כך שאות הקלט לא ייחתך, ושרמות האודיו בדיבור בשיא של האודיו מגיעות בערך ל- -20dBFS -10dBFS.
המכשיר צריך להציג בערך משרעת "שטוחה" לעומת מאפייני תדירות (+- 3 dB 100 Hz עד 8,000 Hz).
העיוות הרמוני הכולל צריך להיות קטן מ-1% מ-100Hz עד 8,000Hz
ברמת קלט של 90dB SPL.
[null,null,["עדכון אחרון: 2023-12-02 (שעון UTC)."],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]