Volume sonore

La norme LUFS (Loudness Units relative to Full Scale) permet de normaliser le volume pour de nombreux genres et styles de production. LUFS est un algorithme complexe basé sur le volume sonore perçu de l'audition humaine à un volume d'écoute confortable et permet aux producteurs audio d'éviter les sauts d'amplitude qui obligeraient les utilisateurs à ajuster le volume en permanence. La fonction LUFS est également appelée LKFS (bruit, pondéré en K, par rapport à "Full Scale").

Lors de la lecture de fichiers audio à l'aide du SSML, le volume moyen doit être de -16 LUFS (Loudness Units Full Scale) pour le contenu audio stéréo, ce qui correspond au volume moyen de la sortie TTS de l'Assistant Google. Ce niveau offre un bon équilibre entre le contrôle global du volume sur l'enceinte à commande vocale et une grande marge de manœuvre pour les matériaux à plage dynamique variable par rapport à l'Assistant Google.

Pour le contenu audio mono, le volume moyen doit être de -19 LUFS au lieu de -16 LUFS. L'objectif de volume pour le contenu audio mono est différent de celui pour le contenu audio stéréo, car lorsque le contenu audio mono est converti en stéréo, en dupliquant la piste audio mono sur les deux canaux d'un signal stéréo, cela double l'énergie du signal, ce qui correspond à une augmentation de la mesure LUFS de 3,01 unités de volume (LU). À l'inverse, lorsqu'un signal stéréo est converti en mono pour être lu sur une seule enceinte, le signal mono est généralement créé en faisant la moyenne du signal de chaque canal, et cette transformation réduit la mesure LUFS exactement de la même manière, soit 3,01 LU. Les mesures du volume pour les contenus mono et stéréo ne sont donc pas directement comparables, mais doivent être décalées de 3,01 LUFS.

Certains outils de mesure du volume permettent de corriger cette disparité. Par exemple, si vous utilisez ffmpeg (voir ci-dessous), vous pouvez utiliser l'option dual_mono (ou dualmono), comme recommandé ci-dessous. Si vous utilisez un indicateur de volume avec cette option et que vous avez activé cette option, la cible de volume doit être de -16 LUFS, que le contenu soit stéréo ou mono.

Nous vous recommandons deux options pour mesurer et régler le volume sonore:

Utiliser un outil de mesure DAW et LUFS

Les étapes suivantes décrivent comment vous assurer que votre contenu audio respecte la recommandation LUFS -16:

  1. Créez tout l'audio à des niveaux élevés et équilibrés (égalisés) de manière constante pendant toute la durée de l'audio, afin d'éviter les pics ou les creux de volume.
  2. Configurez un poste de travail audio numérique (DAW) et un outil de mesure LUFS pour mesurer le volume audio par rapport à la référence Google concernant le volume de la synthèse vocale.
  3. Mesurez et ajustez le volume de votre audio afin qu'il atteigne un volume moyen intégré d'environ -16 LUFS (ou -19 LUFS si le contenu est mono).
  4. Vérifiez votre volume audio en comparant son volume à la référence de volume de la synthèse vocale Google.

Configurer un outil de mesure DAW et LUFS

Il existe de nombreux outils DAW et LUFS disponibles en tant que logiciels sans frais et produits commerciaux. Si vous avez déjà un compteur DAW et LUFS préféré, vous pouvez l'utiliser. Sinon, nous recommandons Audacity pour Windows et Linux ou Reaper pour Mac pour les DAW et TBProAudio dpMeter II pour un outil de mesure LUFS. Dans les sections suivantes, nous partons du principe que vous utilisez ces outils.

Obtenir les fichiers

  1. Téléchargez et installez une DAW :
  2. Téléchargez et installez dpMeter II pour votre système d'exploitation. Cet outil fonctionne avec Audacity et Reaper en tant que plug-in VST (Virtual Studio Technology).
  3. Téléchargez le fichier audio Google TTS Loudness Reference. La synthèse audio indique: "Le volume intégré de cette phrase est d'environ -16 LUFS". Ce fichier sert de fichier audio de test pour l'outil de mesure et de référence pour la vérification de l'oreille.

Configurer dpMeter II pour Audacity (Windows/Linux)

  1. Ouvrez le fichier audio de référence pour le volume de la synthèse vocale Google dans Audacity.
  2. Ouvrez le plug-in dpMeter II en cliquant sur l'onglet Effet et en choisissant Ajouter/Supprimer des plug-ins.
  3. Recherchez dpMeter2 dans la liste, cliquez sur Activer, puis sur OK. Le plug-in dpMeter II apparaît à présent dans le menu déroulant Effect (Effet).
  4. Cliquez sur dpMeter2 dans le menu déroulant Effect (Effet) pour ouvrir le plug-in. dpMeter II utilise par défaut le mode RMS (jeu de couleurs orange). Passez le mode à EBU r128 (jeu de couleurs bleus) pour mesurer la valeur LUFS.

Configurer dpMeter II pour Reaper (Mac)

  1. Ouvrez le fichier audio de référence du volume de la synthèse vocale Google en cliquant sur Insert > Media file (Insérer > Fichier multimédia).
  2. Ouvrez le plug-in dpMeter II en cliquant sur le bouton vert FX (numéro 1 sur la figure) dans le volet gauche de la couche audio. Une fenêtre FX s'affiche.

  3. Cliquez sur dpMeter2 dans la liste. dpMeter II est défini par défaut sur le mode RMS (schéma de couleur orange). Changez le mode sur EBU r128 (jeu de couleurs bleus) pour mesurer la valeur LUFS.

Mesurer et ajuster le volume

Les mesures prises peuvent varier légèrement d'un outil de mesure à l'autre en fonction de la DAW. L'audace a tendance à mesurer la référence sonore de la synthèse vocale Google un peu plus fort que les autres DAW, à -15,1 LUFS, tandis que Reaper donne une mesure de -16,0 LUFS. Tant que votre DAW mesure le volume de la référence Google pour le volume de la synthèse vocale à +/-2 LUFS de -16, cela devrait convenir pour le réglage du volume de votre audio.

Voici les étapes de base pour mesurer et ajuster le volume:

  1. Utilisez dpMeter II pour mesurer le volume de la référence Google concernant le volume de la synthèse vocale afin d'établir une lecture LUFS de référence. Si votre DAW mesure une valeur supérieure ou inférieure à -16 LUFS pour la référence Google concernant le volume de la synthèse vocale, faites correspondre votre audio à la référence de votre DAW. Par exemple, en Audacity, le dpMeter II mesure un volume intégré de -15,1 LUFS. Le nouveau volume cible de votre programme devrait donc être de -15,1 LUFS.
  2. Après avoir établi une référence, ajustez vos données audio pour qu'elles correspondent à la lecture de référence.

Mesurer la référence de volume de la synthèse vocale Google

Cliquez sur le bouton de lecture vert dans dpMeter II ou appuyez sur le bouton de lecture (barre d'espace) de votre DAW (numéro 4 ci-dessous) pour mesurer le volume du fichier.

La liste suivante décrit les principales fonctionnalités que vous pouvez utiliser dans dpMeter II:

  1. Mode: réglez-le sur EBU (au lieu de RMS) pour mesurer le volume en LUFS
  2. Gain Control (Contrôle du gain) : assurez-vous que cette valeur est définie sur 0.0 jusqu'à ce que vous soyez prêt à modifier le volume sonore de votre programme.
  3. Volume intégré: mesure du volume moyen de tous les contenus audio analysés par le plug-in depuis que l'utilisateur a cliqué sur le bouton de réinitialisation (5). Cliquez sur le bouton de réinitialisation (5) avant chaque mesure du volume pour vous assurer que vous ne mesurez que le volume de la sélection actuelle.
  4. Lecture: l'analyse du volume du fichier audio démarre. (Ce bouton n'apparaît pas dans toutes les DAW. Cliquer sur le bouton de lecture principal (barre d'espace) de votre DAW devrait avoir le même effet.)
  5. Réinitialiser: cliquez sur ce bouton entre chaque mesure du volume.
  6. Apply (Appliquer) : lorsque vous êtes prêt à modifier le volume de votre matériel de programme pour qu'il corresponde à la référence Google concernant le volume de la synthèse vocale, ce bouton applique la modification de volume définie par le contrôle du gain (2).

Le volume doit correspondre à celui de la référence de volume de la synthèse vocale Google

Maintenant que vous avez mesuré le volume de la référence de volume de la synthèse vocale Google, vous pouvez mesurer et ajuster le volume de votre audio:

  1. Ouvrez votre fichier audio et cliquez sur dpMeter2 dans le menu Effect (Effet).
  2. Cliquez sur le bouton Play (Lecture) et laissez la valeur de volume intégrée s'ajuster à une valeur moyenne pour votre fichier audio.
  3. Si le volume intégré est différent de la référence Google concernant le volume de la synthèse vocale, ajustez le gain de votre audio pour qu'il corresponde à la référence. Par exemple, si votre audio mesure un volume intégré de -12, il est trop fort. Réduisez donc le gain en définissant le contrôle du gain sur -4 dB et en cliquant sur Appliquer pour l'amener à la plage cible de la référence de volume de la synthèse vocale Google (-16 LUFS). Vous devrez peut-être mesurer et ajuster le gain pour atteindre le volume cible, car il ne correspond qu'à une approximation.

Utiliser ffmpeg

FFmpeg est un framework multimédia doté d'un outil de ligne de commande pour la conversion multimédia. L'outil inclut un filtre appelé loudnorm pour la normalisation du volume. Vous pouvez utiliser “fortnorm” pour générer une version de votre fichier audio au volume LUFS approprié de -16 en utilisant le mode double passage.

  1. Téléchargez et installez FFmpeg.
  2. Accédez au répertoire d'installation et exécutez FFmpeg avec le filtre fortenorm sur votre fichier d'entrée. Veillez à activer l'option dual_mono.

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    Cela indique à FFmpeg de mesurer les valeurs audio de votre fichier multimédia sans créer de fichier de sortie. Une série de valeurs s'affiche comme suit:

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    Les exemples de valeurs ci-dessus indiquent des informations importantes sur les médias entrants. Par exemple, la valeur Input Integrated affichée indique que le son est trop fort. La valeur Output Integrated est beaucoup plus proche de -16,0. Les valeurs Input True Peak et Input LRA, ou plage de volume sonore, sont supérieures aux plafonds fournis et seront réduites dans la version normalisée. Enfin, Target Offset représente le gain de décalage utilisé dans la sortie.

  3. Exécutez une seconde fois le filtre Lfortnorm, en fournissant les valeurs de l'étape 1 en tant que valeurs "mesurées" dans les options de volume.

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    Un fichier, output.wav, est créé. Il contient une version de votre fichier d'entrée dont le volume est normalisé.

Écoutez les exemples suivants de fichier audio avant et après la normalisation ffmpeg de l'intensité du son pour découvrir le fonctionnement de l'outil.

Avant

Après

Contrôle auditif du son

Faites un contrôle auditif pour vous assurer que le son est de bonne qualité par rapport à la référence de volume de la synthèse vocale Google. Pour ce faire, basculez entre l'écoute des fichiers et remarquez les variations de volume ou d'équilibre, et ajustez le gain à l'oreille si nécessaire.

Le volume sonore doit être constant pour les mots prononcés à -16 LUFS (stéréo) ou -19 LUFS (mono). Toutefois, si la plage de fréquences de votre contenu audio est trop élevée (comme les chants d'oiseaux) ou excessivement faible (comme le tonnerre), définir des niveaux sur -16 LUFS (stéréo) ou -19 LUFS (mono) peut le rendre incohérent avec la référence de volume de la synthèse vocale Google. Dans ce cas, un contrôle de l'oreille est particulièrement utile pour équilibrer tout le contenu audio de votre programme.