Halaman ini berisi rekomendasi tentang cara memberikan data ucapan ke
Google Assistant API. Pedoman ini dirancang untuk meningkatkan
efisiensi dan akurasi serta waktu respons yang wajar dari layanan.
Pra-pemrosesan audio
Sebaiknya sediakan audio yang sebersih mungkin dengan menggunakan mikrofon yang berkualitas baik dan diposisikan dengan tepat. Namun, menerapkan pemrosesan sinyal pengurang bising ke audio sebelum mengirimkannya ke layanan biasanya akan mengurangi akurasi pengenalan. Layanan ini dirancang untuk menangani audio yang bising.
Untuk mendapatkan hasil terbaik:
Posisikan mikrofon sedekat mungkin dengan pengguna, terutama ketika
ada suara bising di latar belakang.
Hindari pemangkasan audio.
Jangan gunakan kontrol penguatan otomatis (AGC).
Semua pemrosesan pengurangan bising harus dinonaktifkan.
Idealnya:
Level audio harus dikalibrasi sehingga sinyal input tidak terpotong,
dan level audio ucapan puncak mencapai sekitar -20 hingga -10 dBFS.
Perangkat harus menunjukkan amplitudo "datar" dibandingkan
karakteristik frekuensi (+- 3 dB 100 Hz hingga 8.000 Hz).
Total distorsi harmonik harus kurang dari 1% dari 100 Hz hingga 8.000
Hz pada level input SPL 90 dB.
[null,null,["Terakhir diperbarui pada 2023-12-02 UTC."],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]