Kể từ ngày 13 tháng 6 năm 2023, Hành động trò chuyện không còn được dùng nữa. Để biết thêm thông tin, hãy xem phần Hành động trò chuyện ngừng hoạt động.
Trang này chứa các đề xuất về cách cung cấp dữ liệu lời nói cho API Trợ lý Google. Những nguyên tắc này được thiết kế để mang lại hiệu quả và độ chính xác cao hơn cũng như thời gian phản hồi hợp lý từ dịch vụ.
Xử lý trước âm thanh
Tốt nhất là bạn nên cung cấp âm thanh rõ nhất có thể bằng cách sử dụng micrô có chất lượng tốt và được đặt ở vị trí hợp lý. Tuy nhiên, việc áp dụng cách xử lý tín hiệu giảm tiếng ồn cho âm thanh trước khi gửi đến dịch vụ thường làm giảm độ chính xác của quá trình nhận dạng. Dịch vụ này được thiết kế để xử lý âm thanh ồn.
Để có bức ảnh đẹp nhất, hãy làm như sau:
Đặt micrô càng gần người dùng càng tốt, đặc biệt khi có tạp âm.
Tránh sử dụng đoạn âm thanh.
Không sử dụng chế độ kiểm soát khuếch đại tự động (AGC).
Bạn nên tắt mọi tính năng xử lý giảm tiếng ồn.
Lý tưởng nhất là:
Bạn phải hiệu chỉnh mức âm thanh để tín hiệu đầu vào không bị cắt bớt, và mức âm thanh cao nhất của tiếng nói đạt khoảng -20 đến -10 dBFS.
Thiết bị phải có biên độ gần đúng so với đặc điểm tần số (+- 3 dB 100 Hz đến 8000 Hz).
Tổng độ biến dạng sóng hài phải nhỏ hơn 1% từ 100 Hz đến 8000 Hz ở mức đầu vào 90 dB SPL.
[null,null,["Cập nhật lần gần đây nhất: 2023-12-02 UTC."],[[["The Google Assistant API is designed to handle noisy audio, so noise reduction processing should be disabled prior to sending audio."],["For optimal performance, position the microphone near the user, avoid audio clipping and automatic gain control, and calibrate audio levels to peak between -20 to -10 dBFS."],["Devices used for audio input should ideally have a flat frequency response and minimal harmonic distortion."],["**Warning:** The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead."]]],["The Google Assistant Library for Python is deprecated; use the Google Assistant Service instead. For optimal audio input, provide clean audio from a high-quality, well-positioned microphone. Disable noise reduction and automatic gain control. Position the microphone close to the user and avoid audio clipping. Calibrate audio levels to avoid clipping, with peak levels around -20 to -10 dBFS. Aim for a flat amplitude response (+- 3 dB from 100 Hz to 8000 Hz) and total harmonic distortion under 1%.\n"]]