48kHz vs. 96kHz : Lequel utiliser et pourquoi ?

48kHz vs. 96kHz : Lequel utiliser et pourquoi ? 48kHz vs. 96kHz : Lequel utiliser et pourquoi ?

Si vous avez déjà farfouillé dans les paramètres de votre DAW et que vous êtes resté bouche bée devant l'éventail des taux d'échantillonnage proposés, vous n'êtes pas le seul. Certains DAWS importants (Logic Pro et Pro Tools, par exemple) proposent six taux d'échantillonnage au choix : 44,1, 48, 88,2, 96, 176,4 et 192.

Au cas où vous ne le sauriez pas, la fréquence d'échantillonnage est la résolution à laquelle l'audio est enregistré et, dans le cas des instruments virtuels, produit. Dans ces conditions, on pourrait penser que plus c'est gros, mieux c'est, n'est-ce pas ?

Pas nécessairement.

Bien que la plupart des discussions sur les fréquences d'échantillonnage soient centrées sur les limites de l'audition humaine, il existe d'autres facteurs à prendre en considération lors du choix de la fréquence d'échantillonnage à utiliser pour l'enregistrement.

Et c'est là que nous intervenons. Cet article va plonger profondément (et je dis bien profondément) dans les zéros et les uns de l'audio numérique. Complexe ? Par endroits, oui. Mais à la fin de cet article, vous connaîtrez les avantages et les inconvénients de l'enregistrement à 48 kHz par rapport à 96 kHz, et vous serez en mesure de décider ce qui vous convient le mieux.

Comprendre les taux d'échantillonnage

Choix des fréquences d'échantillonnage dans Logic Pro

Imaginez qu'une voiture passe devant votre maison. Elle se déplace de gauche à droite et passe devant la maison de votre voisin en un seul mouvement continu. C'est l'équivalent du son dans le monde analogique - la forme d'onde est un son continu.

Supposons maintenant que vous souhaitiez reproduire le mouvement de cette voiture. Vous décidez de créer une animation de type flip-book du véhicule se déplaçant de gauche à droite. Plus vous faites d'images de cette voiture en mouvement, plus le mouvement semble détaillé et fluide.

C'est ainsi que fonctionne l'audio numérique : il prend une série d'images (ou d'échantillons) de la forme d'onde analogique à des vitesses ultra-rapides, afin de la reproduire dans le monde numérique.

Les taux d'échantillonnage se réfèrent à la fréquence à laquelle ces instantanés sont pris chaque seconde ; un taux d'échantillonnage de 44,1 kHz signifie que 44 100 échantillons de la forme d'onde entrante sont pris chaque seconde. Des taux d'échantillonnage plus élevés permettent de capturer un plus grand nombre d'instantanés. Mais peut-on entendre ces détails supplémentaires ?

Théorème de Nyquist

Photo par Saad Ahmad sur Unsplash

Un jeune homme intelligent nommé Harry Nyquist a découvert que la fréquence d'échantillonnage doit être au moins deux fois supérieure à la fréquence la plus élevée enregistrée. C'est ce qu'on appelle la fréquence de Nyquist, ou limite de Nyquist.

Étant donné que les humains peuvent entendre une fréquence maximale d'environ 20 kHz, une fréquence d'échantillonnage minimale de 40 kHz est nécessaire pour capturer toutes les fréquences audibles.

Essayer d'enregistrer des fréquences supérieures à cette limite entraîne un repliement (aliasing). Les fréquences plus élevées sont représentées de manière erronée par des fréquences plus basses, ce qui entraîne une distorsion ou des artefacts dans le signal reconstruit.

Tous les convertisseurs numériques-analogiques modernes sont dotés de filtres anticrénelage qui éliminent les artefacts, agissant essentiellement comme un filtre passe-bas qui élimine les hautes fréquences susceptibles d'être altérées. L'enregistrement à des taux d'échantillonnage plus élevés permet à ces filtres de fonctionner sans couper les fréquences audibles.

En termes simples, le théorème de Nyquist est la règle du "combien suffit-il" pour l'enregistrement numérique.

L'émergence de la qualité CD audio

La norme de qualité CD de 44,1 kHz est apparue dans les premiers temps de l'audio numérique, lorsque les disques durs n'étaient pas en mesure de stocker l'équivalent d'un album et que les magnétoscopes ont été réutilisés pour ce travail.

Sur la base de la fréquence des images et des lignes utilisables par image, les têtes de crayon ont stocké 3 échantillons audio par image, ce qui donne une fréquence d'échantillonnage de 44,1 kHz. Il s'agissait de la fréquence d'échantillonnage minimale possible, conforme à la théorie de Nyquist et permettant de stocker le master sur bande vidéo. C'est ce que nous appelons aujourd'hui la qualité audio CD.

Transformée de Fourier

Un spectrogramme en action !

Les fréquences d'échantillonnage n'affectent pas seulement la manière dont un signal est capturé ; elles affectent également la manière dont l'audio numérique est "lu".

La transformée de Fourier est un outil mathématique utilisé pour analyser un signal complexe et le décomposer en formes d'ondes simples à différentes fréquences. C'est ainsi que fonctionnent les plugins tels que les égaliseurs, les spectrogrammes et la détection de la hauteur, en analysant l'ensemble du signal et en le décomposant en bandes plus petites.

En d'autres termes, plus un fichier audio contient d'informations en termes d'instantanés par seconde (taux d'échantillonnage élevés), plus les calculs de la transformée de Fourier seront précis.

Réponse en fréquence

Photo de Saketh sur Unsplash

Un autre facteur à prendre en compte lors de l'examen des fréquences d'échantillonnage est le matériel utilisé pour l'enregistrement et le contrôle.

Chaque appareil audio a une réponse en fréquence, que l'on peut décrire de la manière suivante :

  • Quelles sont les fréquences qu'il peut reproduire, et
  • la précision avec laquelle il le fait.

Si vous utilisez un micro Radioshack minable pour enregistrer une prise sur une guitare minable, et que vous la jouez sur une paire d'enceintes Radioshack minables, il y a de fortes chances que le son ne soit pas bon. Quelle que soit la fréquence d'échantillonnage utilisée.

Take Me Higher

Après avoir passé en revue tous ces aspects scientifiques, nous pouvons constater que des taux d'échantillonnage plus élevés nous permettent de capturer des fréquences plus élevées et de les analyser de manière plus détaillée.

Mais si l'enregistrement à 96 kHz permet de capturer des fréquences jusqu'à 48 kHz, du point de vue de l'écoute humaine, il n'y a pas de réelle différence audible par rapport à un enregistrement à 44,1 kHz. Même pour les personnes dotées d'une ouïe exceptionnelle, les fréquences supérieures resteront hors de portée.

Et grâce à la théorie de Nyquist, nous savons que 44,1 kHz est amplement suffisant pour reproduire parfaitement n'importe quel signal dans la gamme auditive humaine.

Alors pourquoi utiliser des taux d'échantillonnage plus élevés ?

48kHz : La norme industrielle

Photo de Thibault Penin sur Unsplash

Dans le domaine du cinéma, de la télévision et de la diffusion en continu, la fréquence d'échantillonnage de 48 kHz est largement acceptée. Bien qu'il existe des taux d'échantillonnage plus élevés, le 48 kHz s'est imposé comme la norme dans l'industrie des médias grâce à son équilibre entre la qualité, l'efficacité et la compatibilité.

Pourquoi le 48 kHz est-il la norme ?

La principale raison de l'adoption d'une fréquence d'échantillonnage de 48 kHz comme norme dans la production de médias était la compatibilité. Cette fréquence d'échantillonnage s'accordait bien avec les différents systèmes vidéo basés sur la trame utilisés par les télévisions européennes et NTSC, tout en répondant aux exigences de la fréquence de Nyquist.

De nos jours, les plateformes de streaming comme Netflix, Disney et Amazon exigent que l'audio soit livré à 48 kHz, et même si vous composez la musique d'un film traditionnel pour une sortie en salle, vous devrez fournir des stems à 48 kHz pour l'étape du mixage.

Avantages de l'utilisation d'une fréquence d'échantillonnage de 48 kHz

Une autre raison pour laquelle la fréquence d'échantillonnage de 48 kHz s'est largement imposée est l'équilibre qu'elle offre entre la qualité du son et les exigences de traitement.

Anti-crénelage

La fréquence d'échantillonnage légèrement plus élevée offre une plus grande marge de manœuvre aux filtres anti-repliement. À des fréquences d'échantillonnage de 44,1 kHz, un filtre anti-repliement imparfait peut introduire des artefacts subtils mais mesurables.

En revanche, lorsque l'on utilise des taux d'échantillonnage de 48 kHz, tout aliasing qui se produit se situe en dehors du spectre audible.

Rééchantillonnage

Étant donné l'utilisation répandue de la fréquence d'échantillonnage plus élevée dans l'industrie des médias, la livraison de l'audio à 48 kHz minimise la nécessité d'un rééchantillonnage. Alors que le 44,1 kHz est une pratique courante dans l'industrie musicale, si vous travaillez avec une licence de synchronisation, le produit fini devra être livré à 48 kHz.

Le processus de conversion de la fréquence d'échantillonnage lors du suréchantillonnage à 48 kHz à partir de fréquences d'échantillonnage inférieures peut entraîner l'introduction d'artefacts indésirables dans le fichier. C'est pourquoi il est toujours préférable d'enregistrer à une fréquence d'échantillonnage de meilleure qualité et de réduire l'échantillonnage plus tard si nécessaire, par exemple lors de l'impression sur CD.

Taille du fichier

L'enregistrement et le traitement de l'audio à 48 kHz permettent de gérer la taille des fichiers, ce qui est essentiel pour les grands projets télévisuels et cinématographiques où les coûts de stockage et les temps de transfert des données sont un facteur important.

Limites de l'utilisation d'une fréquence d'échantillonnage de 48 kHz

Il y a vraiment très peu de limites à l'utilisation du 48 kHz. Bien qu'il y ait un débat au sein de la communauté audio sur la question de savoir si c'est vraiment "assez bon" pour toutes les applications professionnelles, la différence entre 48 kHz et une fréquence d'échantillonnage plus élevée n'est souvent perceptible que dans des environnements d'écoute très contrôlés et haut de gamme.

96 kHz : Audio haute résolution

Généré par l'IA - veuillez le remplacer !

Bien que la fréquence d'échantillonnage de 48 kHz soit la norme industrielle pour les films, la télévision, les podcasts et autres, certains ingénieurs préfèrent travailler à 96 kHz. Les avantages théoriques comprennent une plus grande marge de manœuvre pour capturer le contenu à haute fréquence, une réduction du repliement et des capacités de traitement améliorées.

Avantages théoriques

Plage d'enregistrement étendue

Une fréquence d'échantillonnage de 96 kHz permet d'enregistrer des fréquences allant jusqu'à 48 kHz. Bien que cette fréquence soit bien supérieure à la gamme de l'audition humaine (qui plafonne généralement autour de 20 kHz), certains affirment que ce contenu à ultra-haute fréquence interagit avec le son de manière subtile, mais que l'homme peut encore l'entendre.

Alias réduit

Vous vous souvenez de la limite de Nyquist ? L'enregistrement à 96 kHz repousse cette limite jusqu'à 48 kHz, réduisant ainsi les risques d'artefacts d'aliasing interférant avec tout son audible.

Meilleur traitement des plugins

Des fréquences d'échantillonnage élevées peuvent également permettre un meilleur traitement de certains effets. Ceci est particulièrement visible lors de l'étirement temporel de l'audio ou de la réalisation de tâches de décalage de la hauteur.

L'étirement temporel de l'audio enregistré à des taux d'échantillonnage plus élevés permet d'obtenir un son plus net, avec une qualité de son plus naturelle. C'est pourquoi de nombreux concepteurs sonores travaillent à une fréquence d'échantillonnage encore plus élevée (192 kHz).

Il en va de même pour les traitements tels que la saturation et la distorsion. Ces plugins ajoutent un contenu haute fréquence supplémentaire au-dessus de la limite de Nyquist originale, de sorte qu'une fréquence d'échantillonnage de 96 kHz réduira les possibilités d'aliasing après l'effet.

Mesure plus précise des pics de l'échantillon

Un autre avantage du travail à 96 kHz est l'amélioration de la précision de la mesure des pics de l'échantillon. Souvent, la crête d'un signal se situe entre les échantillons qui ont été enregistrés - c'est ce que l'on appelle les crêtes inter-échantillons. Un ingénieur de mixage obtiendra une représentation plus précise de l'endroit où se situent les crêtes du signal avec une fréquence d'échantillonnage plus élevée qui contient plus d'échantillons par seconde.

Une qualité audio à l'épreuve du temps

Un autre avantage perçu de l'enregistrement à 96 kHz est de garder une longueur d'avance. Comme la technologie continue d'évoluer, des taux d'échantillonnage plus élevés peuvent devenir la norme, et certains ingénieurs choisissent 96 kHz pour assurer la compatibilité avec les futurs formats à haute résolution.

Inconvénients de l'utilisation d'une fréquence d'échantillonnage de 96 kHz

L'enregistrement à 96 kHz présente de nombreux avantages théoriques et permet d'obtenir un son de meilleure qualité lors du time-stretching et des tâches d'édition. Mais ces avantages s'accompagnent de compromis pratiques par rapport à l'utilisation d'une fréquence d'échantillonnage inférieure.

Taille du fichier

Chaque fois que vous doublez une fréquence d'échantillonnage, la quantité de données que vous générez double également. Une session enregistrée à 96 kHz occupera deux fois plus d'espace qu'une session à 48 kHz en raison des fichiers beaucoup plus volumineux qui sont créés.

Pour les projets complexes, cela peut rapidement faire exploser les besoins en stockage et rendre les sauvegardes, le partage et la gestion des fichiers plus difficiles.

Puissance de traitement

Comme on peut s'y attendre, une fréquence d'échantillonnage plus élevée exige plus de puissance de la part de l'unité centrale. À moins que vous ne disposiez d'une machine ultra-performante, il se peut que votre session souffre d'une latence accrue, de temps de rendu plus lents et d'une instabilité du système.

Performance DAW

Bien que la plupart des logiciels audionumériques prennent en charge des taux d'échantillonnage plus élevés, l'exécution d'une session à 96 kHz ou plus signifie que le logiciel audionumérique doit travailler plus dur pour diffuser l'audio. En fonction de votre système et de la complexité de la session, il existe un risque accru d'interruptions ou de problèmes. Ce n'est pas l'idéal lorsque vous mixez votre prochain morceau.

Performance des plugins

Certains plugins suréchantillonnent en interne le signal entrant pour améliorer la qualité de la sortie résultante, par exemple les plugins de mesure ou les limiteurs. Les faire fonctionner à une fréquence d'échantillonnage déjà élevée peut nuire aux performances du processeur.

Efficacité des flux de travail

Bien que des taux d'échantillonnage plus élevés puissent offrir des avantages théoriques et une protection future, l'exécution d'une session à un taux plus élevé peut ralentir votre flux de travail sans aucun avantage perceptible.

  • Certaines interfaces audio bon marché ne peuvent pas gérer des taux d'échantillonnage de 96 kHz, ce qui peut entraîner une distorsion du son.
  • Vous devrez presque toujours procéder à un sous-échantillonnage pour créer les produits finaux, ce qui créera des étapes de conversion inutiles en cours de route.
  • Si votre système éprouve des difficultés à exécuter une session à une fréquence d'échantillonnage plus élevée, les choses prendront inévitablement plus de temps. Le mixage deviendra fastidieux, et vous devrez toujours procéder à un sous-échantillonnage par la suite.

Peut-on entendre la différence entre 48 kHz et 96 kHz ?

Photo de Mark Paton sur Unsplash

La question à un million de dollars dans cette discussion est la suivante : les gens peuvent-ils réellement entendre la différence entre 48 kHz et 96 kHz ?

Cela dépend de la personne à qui l'on s'adresse.

Certains auditeurs expérimentés, notamment les ingénieurs de mastering et les audiophiles, affirment être capables d'entendre des différences subtiles entre les fréquences d'échantillonnage, en particulier s'il s'agit d'un instrument auquel ils sont très sensibles.

Certains font remarquer que même si nous ne pouvons pas entendre la différence entre les deux taux d'échantillonnage, l'existence d'un contenu ultra-sonique dans le son pourrait avoir un impact sur l'expérience d'écoute en raison de l'interaction harmonique.

La question de savoir si cela est dû à des différences sonores réelles ou à un simple préjugé psychologique est à débattre. Mais plusieurs éléments influencent la façon dont nous entendons le son.

Systèmes de lecture

Vous vous souvenez de la discussion sur la réponse en fréquence ? Même si vous avez une ouïe surhumaine, bien au-delà de la gamme des 20 kHz, si les enceintes que vous écoutez ne prennent pas en charge ces fréquences ultrasoniques, la fréquence d'échantillonnage plus élevée devient inutile.

Limites de l'audition humaine

La plupart des adultes voient leur audition se dégrader dans les plages supérieures avec l'âge. Même si les fréquences ultra-hautes sont présentes dans un son, il y a de fortes chances que de nombreux auditeurs ne puissent pas les entendre de toute façon.

Considérations pratiques

Nous pouvons résumer cette discussion à deux idées :

  • Le 48 kHz est la norme de l'industrie des médias et répond à toutes les exigences sonores.
  • 96 kHz, c'est un peu cool, mais c'est aussi un peu lourd.

Le choix de la bonne fréquence d'échantillonnage pour votre projet dépend de vos besoins spécifiques et de votre flux de travail. Voici une analyse pratique des différents domaines de la production audio.

Production musicale : Enregistrement, mixage et mastering

Lorsque vous travaillez uniquement sur de la musique, le choix de la fréquence d'échantillonnage se résume à un équilibre entre la qualité audio et l'efficacité du système.

  • Enregistrement: Certains ingénieurs aiment utiliser des fréquences d'échantillonnage élevées de 96 kHz ou plus pour capturer tous les détails sonores et éviter les erreurs d'aliasing. Cependant, pour la plupart des musiques, 48 kHz est plus que suffisant, et représente moins de contraintes pour les capacités du système et le stockage. De plus, il n'est pas nécessaire d'utiliser une horloge maîtresse pour maintenir la synchronisation.
  • Mixage et mastering: De nombreux plugins proposent aujourd'hui un suréchantillonnage interne afin d'obtenir une sortie plus précise. Travailler à 48 kHz permet donc toujours d'obtenir une qualité audio de haut niveau.
  • Livraison finale: les plateformes de diffusion en continu ont tendance à accepter les fichiers avec une fréquence d'échantillonnage de 44,1 ou 48 kHz. Si la musique est destinée à être reproduite sur CD, le mixage final devra être converti en 44,1 kHz. Dans tous les cas, l'enregistrement à des fréquences d'échantillonnage élevées est inutile dans ces situations.

Audio pour le cinéma et la télévision

Dans le domaine du cinéma et de la télévision (y compris les licences de synchronisation ), 48 kHz est l'étalon-or. Dans la plupart des cas, la résolution de la profondeur de bit devra être de 16 bits, bien qu'il soit conseillé d'enregistrer à une profondeur de bit de 24 bits pour commencer et de réduire la profondeur de bit pour la livraison.

Compte tenu du nombre élevé de pistes dans les sessions de post-production, l'enregistrement à 96 kHz pourrait poser des problèmes d'efficacité du système et d'espace de stockage.

Jeux et RV

L'audio dans les jeux et les scénarios de réalité virtuelle nécessite souvent des taux d'échantillonnage plus élevés en raison des exigences uniques du format.

Il est souvent nécessaire de procéder à un étirement temporel et à un décalage de la hauteur des sons, il est donc préférable d'enregistrer à 96 kHz.

Sonorisation en direct et diffusion en continu

Dans les situations en direct, la performance en temps réel est une priorité absolue, ce qui fait de 48 kHz le meilleur choix.

Recommandations finales

En règle générale, la manière la plus efficace d'enregistrer de l'audio est d'utiliser une profondeur de bits de 24 et une fréquence d'échantillonnage de 48 kHz.

Ces réglages constituent un compromis entre la clarté sonore et l'efficacité en termes de stockage et de performances du processeur.

De nombreux plugins effectuent déjà un suréchantillonnage interne lorsqu'ils travaillent à ces taux, ce qui signifie que les avantages de l'enregistrement à 96 kHz sont négligeables.

En outre, des limiteurs et des compteurs numériques de haute qualité compensent les pics entre les échantillons, ce qui réduit la nécessité d'utiliser des taux d'échantillonnage plus élevés.

Enfin, 48 kHz est une norme industrielle pour la plupart des travaux professionnels, ce qui garantit une intégration transparente avec les collaborateurs et les distributeurs.

Les quelques situations où il peut être intéressant d'utiliser 96 kHz pour l'enregistrement sont les suivantes :

  • un projet nécessite une extension temporelle, un décalage de hauteur ou une édition importante (telle que la synthèse granulaire).
  • un projet est destiné à l'archivage et vous souhaitez assurer la pérennité du travail.

Conclusion

Nous avons parcouru beaucoup de chemin ! Voici un bref récapitulatif de ce qui a été abordé. Les notes de synthèse, si vous voulez :

  • Une fréquence d'échantillonnage de 44,1 kHz est capable de reproduire parfaitement les signaux audio jusqu'aux fréquences les plus élevées dans la gamme de l'audition humaine.
  • L'industrie de la télévision, du cinéma et des médias utilise 48 kHz comme norme.
  • L'enregistrement à 96 kHz nécessite plus de puissance de traitement et plus d'espace disque pour stocker les fichiers plus volumineux qui en résultent.
  • L'utilisation de taux d'échantillonnage de plus en plus élevés entraîne des rendements décroissants en ce qui concerne l'efficacité du système et les coûts de stockage.
  • Si vous savez que vous utiliserez le time-stretching et d'autres fonctions d'édition sur votre audio, enregistrez à 96 kHz pour de meilleurs résultats.

N'oubliez pas que le contexte dans lequel vous travaillez est plus important que la chasse aux chiffres.

Si vous êtes un artiste, votre public peut ne pas se soucier du fait que vous ayez produit une piste à 96 kHz. En fait, il est peu probable qu'il entende la différence avec un morceau enregistré à 44,1 kHz.

Si vous enregistrez de la musique pour le cinéma et la télévision, 48 kHz est l'équilibre parfait entre la qualité du son et les normes professionnelles.

Et si vous créez une bibliothèque de sons pour une bibliothèque d'effets, 96 kHz est la meilleure solution pour permettre des capacités d'édition maximales.

En fin de compte, c'est vous qui décidez. Expérimentez différentes fréquences d'échantillonnage et voyez ce qui vous convient le mieux. Si vous entendez une différence notable à 96 kHz, foncez ! (Mais achetez peut-être un plus gros disque dur...).

Quel que soit votre choix, allez-y et faites de la musique !

Donnez vie à vos chansons grâce à un mastering de qualité professionnelle, en quelques secondes !