این صفحه حاوی توصیههایی درباره نحوه ارائه دادههای گفتاری به Google Assistant API است. این دستورالعمل ها برای کارایی و دقت بیشتر و همچنین زمان پاسخگویی معقول از سرویس طراحی شده اند.
پیش پردازش صدا
بهتر است با استفاده از یک میکروفون با کیفیت و دارای موقعیت مناسب، صدایی را ارائه دهید که تا حد امکان تمیز باشد. با این حال، اعمال پردازش سیگنال کاهش نویز روی صدا قبل از ارسال آن به سرویس، معمولاً دقت تشخیص را کاهش میدهد. این سرویس برای کنترل صدای پر سر و صدا طراحی شده است.
برای بهترین نتایج:
میکروفون را تا حد امکان نزدیک به کاربر قرار دهید، به خصوص زمانی که نویز پس زمینه وجود دارد.
از کلیپ صوتی خودداری کنید.
از کنترل بهره خودکار (AGC) استفاده نکنید.
تمام پردازش های کاهش نویز باید غیرفعال شود.
در حالت ایده آل:
سطح صدا باید طوری کالیبره شود که سیگنال ورودی قطع نشود و حداکثر سطوح صوتی گفتاری تقریباً به -20 تا -10 dBFS برسد.
دستگاه باید دامنه تقریباً «مسطح» نسبت به ویژگیهای فرکانس (+- 3 دسیبل 100 هرتز تا 8000 هرتز) را نشان دهد.
اعوجاج هارمونیک کل باید کمتر از 1% از 100 هرتز تا 8000 هرتز در سطح ورودی SPL 90 دسی بل باشد.
تاریخ آخرین بهروزرسانی 2024-10-30 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-10-30 بهوقت ساعت هماهنگ جهانی."],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]