Độ lớn âm thanh

LUFS (Đơn vị độ lớn so với quy mô đầy đủ) là một tiêu chuẩn cho phép chuẩn hoá âm lượng trên nhiều thể loại và kiểu sản xuất. LUFS là một thuật toán phức tạp dựa trên âm lượng mà con người nhận thấy được ở mức âm lượng nghe thoải mái, đồng thời giúp các nhà sản xuất âm thanh tránh việc tăng biên độ đòi hỏi người dùng phải liên tục điều chỉnh âm lượng. LUFS còn được gọi là LKFS (Độ lớn, trọng số K, so với Thang đo đầy đủ)

Khi phát lại các tệp âm thanh bằng SSML, độ ồn trung bình phải là -16 LUFS (Quy mô lớn đơn vị âm thanh) cho nội dung âm thanh âm thanh nổi, khớp với âm lượng trung bình của đầu ra TTS của Trợ lý Google. Mức âm lượng này mang đến sự cân bằng tốt giữa khả năng điều khiển âm lượng tổng thể trên loa kích hoạt bằng giọng nói và khoảng trần rộng rãi cho nội dung có phạm vi động thay đổi so với Trợ lý Google.

Đối với nội dung âm thanh đơn âm, độ ồn trung bình phải là -19 LUFS, thay vì -16 LUFS. Mục tiêu độ ồn cho nội dung âm thanh đơn khác với nội dung âm thanh nổi vì khi nội dung âm thanh đơn âm được chuyển đổi thành âm thanh nổi, bằng cách sao chép bản âm thanh đơn âm trên cả hai kênh của tín hiệu âm thanh nổi, điều này sẽ làm tăng gấp đôi năng lượng của tín hiệu, tương ứng với mức tăng trong phép đo LUFS của Đơn vị độ lớn (LU). Ngược lại, khi chuyển đổi tín hiệu âm thanh nổi thành đơn âm để phát trên một loa, tín hiệu đơn âm thường được tạo bằng cách lấy trung bình tín hiệu từ mỗi kênh, và phép biến đổi đó làm giảm chỉ số đo lường LUFS xuống đúng 3, 01 LU. Vì vậy, không thể so sánh trực tiếp các thông tin đo lường âm lượng cho nội dung đơn âm và âm thanh nổi, mà cần được bù trừ bằng LUFS 3.01.

Một số máy đo độ ồn có các tuỳ chọn để điều chỉnh sự chênh lệch này; ví dụ: nếu đang sử dụng ffmpeg (xem bên dưới), bạn có thể sử dụng tuỳ chọn dual_mono (hoặc dualmono), như đề xuất bên dưới. Nếu bạn đang sử dụng đồng hồ đo độ ồn có tuỳ chọn như vậy và đã bật tuỳ chọn đó, thì mục tiêu âm lượng sẽ là -16 LUFS, bất kể nội dung là âm thanh nổi hay đơn âm.

Bạn nên có hai tuỳ chọn để đo và điều chỉnh độ to của âm thanh:

Sử dụng máy đo DAW và LUFS

Các bước sau đây mô tả cách đảm bảo âm thanh của bạn đáp ứng mức đề xuất -16 LUFS:

  1. Tạo tất cả âm thanh ở mức âm lượng lớn và cân bằng (cân bằng) nhất quán trong toàn bộ thời lượng của âm thanh để không có hiện tượng tăng hoặc sụt giảm đột biến.
  2. Thiết lập máy trạm âm thanh kỹ thuật số (DAW) và máy đo LUFS để đo độ lớn âm thanh so với Tham chiếu âm lượng TTS của Google.
  3. Đo lường và điều chỉnh độ to của âm thanh để âm thanh có độ to trung bình khoảng -16 LUFS (hoặc -19 LUFS nếu nội dung là đơn âm).
  4. Kiểm tra âm thanh của bạn bằng cách so sánh độ to của âm thanh đó với Tham chiếu độ to của Google TTS.

Thiết lập máy đo DAW và LUFS

Có nhiều máy đo DAW và LUFS dưới dạng phần mềm miễn phí và sản phẩm thương mại. Nếu đã có máy đo DAW và LUFS ưu tiên, bạn có thể sử dụng công cụ đó. Nếu không, bạn nên dùng Audacity cho Windows và Linux hoặc Reaper cho Mac đối vớiDAW và TBProAudio dpMeter II cho máy đo LUFS. Các phần sau đây giả định rằng bạn đang sử dụng các công cụ này.

Tải tệp

  1. Tải xuống và cài đặt DAW:
    • Đối với Windows hoặc Linux: Audacity
    • Đối với Mac: Reaper
  2. Tải xuống và cài đặt dpMeter II cho hệ điều hành của bạn. Công cụ này hoạt động với cả Audacity và Reaper dưới dạng trình bổ trợ VST (Công nghệ Studio ảo).
  3. Tải tệp âm thanh Tham chiếu độ lớn TTS của Google xuống. Âm thanh TTS cho biết: "Độ to tích hợp của câu này là khoảng -16 LUFS". Tệp này đóng vai trò là âm thanh kiểm tra cho đồng hồ đo cũng như dữ liệu tham chiếu kiểm tra tai.

Định cấu hình dpMeter II cho Audacity (Windows/Linux)

  1. Mở tệp âm thanh Tham chiếu âm lượng lớn TTS của Google trong Audacity.
  2. Mở trình bổ trợ dpMeter II bằng cách nhấp vào thẻ Effect (Hiệu ứng) rồi chọn Add/Remove Plugin-ins (Thêm/Xoá Plugin).
  3. Tìm dpMeter2 trong danh sách, nhấp vào Enable (Bật), sau đó nhấp vào OK. Trình bổ trợ dpMeter II hiện sẽ xuất hiện trong trình đơn thả xuống Effect (Hiệu ứng).
  4. Nhấp vào dpMeter2 từ trình đơn thả xuống Effect (Hiệu ứng) để mở trình bổ trợ. dpMeter II mặc định ở chế độ RMS (bảng phối màu cam). Hãy thay đổi chế độ thành EBU r128 (bảng phối màu xanh dương) để đo lường LUFS.

Định cấu hình dpMeter II cho Reaper (máy Mac)

  1. Mở âm thanh Tham chiếu độ lớn TTS của Google bằng cách nhấp vào Insert > Media file.... (Chèn > Tệp nội dung đa phương tiện).
  2. Mở trình bổ trợ dpMeter II bằng cách nhấp vào nút FX màu xanh lục (số 1 trong hình) trên ngăn bên trái của lớp âm thanh. Một cửa sổ FX sẽ xuất hiện.

  3. Nhấp vào dpMeter2 trong danh sách. dpMeter II mặc định ở chế độ RMS (lược đồ màu cam). Thay đổi chế độ thành EBU r128 (bảng phối màu xanh dương) để đo LUFS.

Đo và điều chỉnh âm lượng

Mỗi đơn vị đo sẽ khác nhau một chút trong các DAW khác nhau sẽ dẫn đến kết quả đọc hơi khác nhau. Audacity có xu hướng đo lường Tham chiếu âm lượng TTS của Google to hơn một chút so với các DAW khác, ở mức -15.1 LUFS, trong khi Reaper cho mức đọc -16.0 LUFS. Miễn là DAW đo âm lượng của Tham chiếu mức âm lượng TTS của Google trong phạm vi +/-2 LUFS là -16, thì bạn có thể đặt độ to cho âm thanh.

Các bước cơ bản để đo và điều chỉnh âm lượng là:

  1. Sử dụng dpMeter II để đo âm lượng của Tham chiếu âm lượng TTS của Google nhằm thiết lập giá trị đọc LUFS cơ sở. Nếu DAW đang đo cao hơn hoặc thấp hơn -16 LUFS cho Tham chiếu âm lượng TTS của Google, hãy so khớp âm thanh của bạn với đường cơ sở của DAW. Ví dụ: trong Audacity, dpMeter II đo lường độ ồn tích hợp là -15,1 LUFS. Vì vậy, độ ồn mục tiêu mới cho chương trình của bạn sẽ là -15,1 LUFS.
  2. Sau khi thiết lập đường cơ sở, hãy điều chỉnh âm thanh cho phù hợp với cách đọc đường cơ sở.

Đo tham chiếu độ lớn TTS của Google

Nhấp vào nút phát màu xanh lục trong dpMeter II hoặc nhấn phím phát (phím cách) trong DAW (số 4 bên dưới) để đo độ lớn của tệp.

Danh sách sau đây mô tả các tính năng chính mà bạn có thể sử dụng trong dpMeter II:

  1. Mode (Chế độ): Đặt thành EBU (thay vì RMS) để đo âm lượng trong LUFS
  2. Gain Control (Điều khiển khuếch đại): Đảm bảo giá trị này được đặt thành 0.0 cho đến khi bạn sẵn sàng thay đổi âm lượng của chương trình.
  3. Độ lớn tích hợp: Đây là đơn vị đo âm lượng trung bình của tất cả âm thanh mà trình bổ trợ đã phân tích kể từ khi người dùng nhấp vào nút đặt lại (5). Nhấp vào nút đặt lại (5) trước mỗi lần đo độ lớn để đảm bảo rằng bạn chỉ đo độ to của lựa chọn hiện tại.
  4. Phát: Thao tác này sẽ bắt đầu quá trình phân tích âm lượng của tệp âm thanh. (Nút này không xuất hiện trong một số DAW). Thao tác nhấp vào nút phát chính (phím cách) trong DAW sẽ có tác dụng tương tự.)
  5. Đặt lại: Nhấp vào nút này giữa mỗi lần đo độ to.
  6. Apply (Áp dụng): Khi bạn đã sẵn sàng thay đổi âm lượng của nội dung trong chương trình cho phù hợp với Tham chiếu âm lượng TTS của Google, nút này sẽ áp dụng thay đổi âm lượng do bộ điều khiển độ khuếch đại (2) đặt ra.

Âm lượng phù hợp với tham chiếu độ lớn TTS của Google

Giờ đây, bạn đã đo được độ to của tham chiếu độ lớn TTS của Google, bạn có thể đo và điều chỉnh độ to của âm thanh:

  1. Mở tệp âm thanh rồi nhấp vào chọn dpMeter2 trên trình đơn Effect (Hiệu ứng).
  2. Nhấp vào nút Play (Phát) rồi để giá trị âm lượng tích hợp trở thành giá trị trung bình cho tệp âm thanh.
  3. Nếu âm lượng tích hợp khác với tham chiếu âm lượng TTS của Google, hãy điều chỉnh mức tăng âm thanh cho khớp với tham chiếu. Ví dụ: nếu âm thanh của bạn đo ở mức âm lượng tích hợp là -12, thì âm thanh là quá to, vậy nên hãy giảm mức tăng âm bằng cách đặt Gain Control (Điều khiển độ lợi) thành -4db rồi nhấp vào Apply (Áp dụng) để đưa âm thanh đó đến phạm vi mục tiêu của Tham chiếu âm lượng TTS của Google (-16 LUFS). Có thể bạn cần đo lường và điều chỉnh mức tăng âm để đạt được độ ồn mục tiêu, vì mức tăng chỉ tương đương với LUFS.

Sử dụng ffmpeg

FFmpeg là một khung nội dung nghe nhìn có công cụ dòng lệnh để chuyển đổi nội dung nghe nhìn. Công cụ này có một bộ lọc có tên là loudnorm để chuẩn hoá độ ồn. Bạn có thể sử dụng mutenorm để xuất một phiên bản tệp âm thanh ở độ ồn -16 LUFS thích hợp bằng chế độ truyền kép.

  1. Tải xuống và cài đặt FFmpeg.
  2. Chuyển đến thư mục cài đặt và chạy FFmpeg bằng bộ lọc tonorm trên tệp đầu vào của bạn. Nhớ bật tuỳ chọn dual_mono.

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    Thao tác này sẽ hướng dẫn FFmpeg đo các giá trị âm thanh của tệp nội dung đa phương tiện mà không cần tạo tệp đầu ra. Bạn sẽ nhận được một chuỗi giá trị được thể hiện như sau:

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    Các giá trị mẫu ở trên cho biết thông tin quan trọng về nội dung nghe nhìn sắp tới. Ví dụ: giá trị Input Integrated hiển thị cho biết âm thanh quá to. Giá trị Output Integrated gần hơn với -16.0. Cả hai giá trị Input True PeakInput LRA (hay phạm vi độ to) đều cao hơn mức trần mà chúng tôi cung cấp và sẽ giảm trong phiên bản chuẩn hoá. Cuối cùng, Target Offset đại diện cho mức tăng bù trừ được dùng trong đầu ra.

  3. Chạy lượt thứ hai của bộ lọc tonorm, cung cấp các giá trị từ bước 1 dưới dạng các giá trị "được đo lường" trong các tuỳ chọn tonorm.

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    Một tệp output.wav sẽ được tạo có chứa phiên bản được chuẩn hoá âm lượng của tệp đầu vào.

Hãy nghe các ví dụ sau về tệp âm thanh trước và sau khi chuẩn hoá độ lớn ffmpeg để nghe cách hoạt động của công cụ.

Trước

Sau

Kiểm tra âm thanh của bạn

Hãy kiểm tra tai để đảm bảo âm thanh của bạn nghe tốt so với Tài liệu tham khảo độ ồn của Google TTS. Để thực hiện việc này, hãy chuyển đổi giữa việc nghe các tệp và chú ý mọi mức tăng âm lượng hoặc mức cân bằng, đồng thời điều chỉnh mức tăng âm lượng theo tai nếu cần.

Độ to phải nhất quán đối với lời nói ở mức -16 LUFS (âm thanh nổi) hoặc -19 LUFS (âm thanh đơn âm). Tuy nhiên, nếu dải tần số của âm thanh quá cao (như tiếng chim hót) hoặc quá thấp (như tiếng sấm), thì việc đặt mức âm thanh thành -16 LUFS (âm thanh nổi) hoặc -19 LUFS (đơn âm) có thể làm cho âm thanh này không nhất quán với Tham chiếu độ to của TTS của Google. Trong trường hợp này, việc kiểm tra tai sẽ đặc biệt hữu ích trong việc cân bằng tất cả âm thanh trong chương trình của bạn.