Avez-vous déjà remarqué que, lorsque vous êtes au cœur d'un jeu, vous entendez toutes sortes de sons, tels que des bruits de pas, des explosions et des bruits ambiants, qui semblent tous parfaitement synchronisés avec vos actions ? La plupart de ces sons sont des échantillons audio préenregistrés par des concepteurs sonores talentueux.
Ces petites bribes de son se présentent également sous de nombreuses formes, y compris des sons uniques, comme un seul coup de feu, ou des boucles, comme le bourdonnement constant du moteur d'un vaisseau spatial. Cependant, ce que vous ne saviez peut-être pas, c'est que tous les sons des jeux vidéo ne proviennent pas d'échantillons préenregistrés. Certains sons sont créés à la volée pendant que vous jouez.
C'est ce que nous appelons l'audio procédural, que j'aime considérer comme le petit compositeur personnel d'un jeu. Grâce à elle, nous sommes en mesure de créer des sons de manière dynamique pendant le jeu, sans dépendre de fichiers audio préenregistrés. Cela signifie que le son que vous entendez lorsqu'un personnage marche sur du gravier peut être légèrement différent à chaque fois, ce qui rend le jeu encore plus immersif et réaliste.
Dans ce guide, nous allons examiner tout ce qu'il y a à savoir sur l'audio procédural, y compris son histoire, son fonctionnement et quelques exemples sympas de son utilisation dans les jeux modernes.
Alors, que vous soyez un concepteur sonore en herbe ou simplement curieux de connaître la technologie qui se cache derrière vos jeux préférés, restez dans les parages ! Nous avons beaucoup de choses à couvrir.
Qu'est-ce que l'audio procédural ?
L'audio procédural est un aspect fascinant de la conception sonore des jeux. L'idée est de créer des sons au moment de l'exécution ou générés à la volée, pendant que vous jouez, plutôt que d'être préenregistrés et diffusés.
En termes simples, la conception sonore procédurale crée des effets sonores basés sur des comportements prédéterminés. Il s'agit d'un système qui sait comment générer un bruit de pas lorsque votre personnage marche sur différentes surfaces, sans avoir besoin d'un échantillon préenregistré pour chaque pas. Au lieu de cela, il synthétise le son en temps réel, ce qui rend chaque pas légèrement unique.
Cette technique est similaire à la génération procédurale utilisée dans d'autres parties des jeux, comme l'art environnemental et la conception des niveaux. Tout comme un jeu peut créer une nouvelle forêt ou un nouveau donjon à chaque fois que vous jouez, l'audio procédural crée des paysages sonores que vous entendez en fonction de l'état actuel du jeu et de vos interactions.
En utilisant l'audio procédural, les concepteurs sonores peuvent créer des paysages sonores profondément intégrés, qui réagissent aux actions du joueur et à l'environnement du jeu d'une manière cohérente et crédible.
Toutefois, l'utilisation de techniques courantes de conception sonore procédurale présente des inconvénients.
L'une des principales difficultés réside dans la complexité de garantir la qualité et le réalisme des sons. La création d'un son procédural convaincant peut être plus exigeante sur le plan technique que l'utilisation d'échantillons préenregistrés. En outre, elle peut nécessiter plus d'unité centrale, ce qui peut avoir un impact sur les performances du jeu, en particulier sur les systèmes bas de gamme.
Une histoire de la création sonore procédurale
Au début des jeux, la conception de sons procéduraux n'était pas seulement une forme d'art. C'était une nécessité pour le son. La mémoire vive limitée des premières consoles de jeu ne permettait pas de stocker des échantillons audio préenregistrés, l'alternative à l'audio procédural. Cette contrainte a poussé les développeurs à générer des sons en temps réel au fur et à mesure que le jeu se déroulait.
Le son dans les jeux a commencé avec le jeu emblématique Pong sur le Magnavox Odyssey en 1972. Il est intéressant de noter que le Magnavox Odyssey original n'avait pas de son du tout. C'est la version Atari de Pong qui est entrée dans l'histoire en intégrant le son. Atari y est parvenu en utilisant l'adaptateur d'interface de télévision (TIA ), un matériel conçu pour gérer les sorties vidéo et audio.
Le TIA pouvait générer des ondes sonores à l'aide de deux oscillateurs. En manipulant ces oscillateurs, la version Atari de Pong pouvait créer un son simple mais efficace, marquant le premier exemple de conception sonore procédurale dans les jeux.
Dans le jeu, il y avait trois sons principaux, chacun généré de manière procédurale :
- Le premier son a été le bip émis lorsque la balle touchait les palettes, ce qui a permis aux joueurs d'obtenir un retour d'information audio immédiat sur leurs frappes
- Le deuxième son était un son de pong plus profond lorsque la balle entrait en collision avec les murs, ce qui le différenciait des coups de pagaie.
- Le troisième son était un bruit plus aigu pour marquer des points, signalant qu'un point avait été marqué.
Bien que basiques par rapport aux normes actuelles, ces sons ont ajouté une nouvelle couche d'engagement et de retour d'information qui était cruciale pour l'expérience immersive du jeu.
Bien entendu, la complexité et la qualité de l'audio procédural se sont accrues au fur et à mesure que la technologie évoluait.
L'évolution de l'audio procédural
À la fin des années 1970, l'audio procédural a commencé à prendre forme sur diverses consoles de jeu. Trois systèmes notables de cette époque sont l'Atari 2600, le Fairchild Channel F et le Bally Astrocade. Chacune de ces consoles utilisait l'audio procédural pour améliorer l'expérience de jeu dans les limites de leur matériel.
Les progrès réalisés dans les années 1980 ont permis de repousser les limites de l'audio des jeux.
En 1983, le Vectrex a introduit un nouveau niveau de synthèse audio, tandis que Nintendo a fait des progrès significatifs avec la sortie de la Nintendo Entertainment System (NES) en 1985. La NES utilisait un système audio à cinq canaux qui prenait en charge une gamme de fréquences plus large, de 54 Hz à 28 kHz, et pouvait effectuer des pitch bends. Des jeux emblématiques comme Super Mario Bros. ont établi une référence pour l'audio procédural avec des sons mémorables tels que le "ping" de la collecte de pièces, le son du "champignon" des bonus et l'effet de "saut".
En 1986, le Sega Master System a permis une évolution encore plus importante de l'audio des jeux. Elle intègre à la fois l'échantillonnage et la synthèse électronique, en utilisant quatre canaux audio (trois pour la musique et un pour les effets sonores). Le Master System était équipé de la puce YM2413 de Yamaha, la même que celle utilisée dans leurs synthétiseurs professionnels, ce qui améliorait considérablement la qualité et la complexité des sons qu'il pouvait produire.
L'évolution s'est poursuivie avec la sortie de la Sega Mega Drive (Genesis) en 1988 et de la Super Nintendo Entertainment System (SNES) en 1990. Ces deux consoles ont introduit des fonctionnalités audio plus sophistiquées, notamment des échantillons de meilleure qualité et un plus grand nombre de canaux pour des paysages sonores plus riches.
Cependant, ce n'est qu'avec la sortie de la Sega Saturn en 1994 que nous avons pu voir une autre étape importante dans l'évolution de l'audio des jeux. Elle était équipée d'une puce et d'un processeur de son capables de prendre en charge jusqu'à 16 canaux audio avec une qualité CD de 44,1 kHz, ouvrant ainsi la voie au son de haute qualité que nous attendons dans les jeux modernes.
Effets sonores et musique préenregistrés
En 1994, le monde du jeu a connu un changement monumental avec la sortie de la PlayStation de Sony. Cette console a apporté une amélioration significative des capacités audio, offrant une fréquence d'échantillonnage de 44,1 kHz et 24 canaux audio stéréo. La puce sonore de la PlayStation a changé la donne, en permettant des effets de réverbération et des boucles.
Grâce à cette nouvelle flexibilité, les compositeurs et les concepteurs sonores ont pu créer des paysages sonores plus complexes et plus immersifs afin d'enrichir l'expérience de chaque joueur.
Avant l'ère de la PlayStation, la création de sons pour les jeux nécessitait une connaissance approfondie de la programmation audio et de l'audio procédural. Les créateurs de sons devaient être rompus au codage complexe et au traitement des signaux pour générer et mettre en œuvre des effets sonores et de la musique. Cela rendait le processus très laborieux et limitait souvent la créativité de ceux qui étaient plus enclins à la musique mais moins compétents sur le plan technique.
À bien des égards, la PlayStation a révolutionné ce processus en permettant d'intégrer facilement des effets sonores et de la musique préenregistrés dans les jeux. Les compositeurs et les concepteurs sonores n'avaient plus à se préoccuper des subtilités du son procédural. Ils pouvaient se concentrer uniquement sur la création d'effets sonores et de musique de haute qualité, qu'ils transmettaient ensuite aux développeurs pour qu'ils les intègrent dans le jeu.
L'audio procédural est-il démodé ?
Malgré l'essor des effets sonores et de la musique préenregistrés, l'audio procédural est loin d'être démodé. De nombreux jeux post-PlayStation continuent d'exploiter les modèles mathématiques de l'audio procédural. Jetons un coup d'œil à quelques-uns des plus populaires.
Jeux modernes utilisant l'audio procédural
Spore
Dans le jeu révolutionnaire Spore de 2008, les programmeurs audio Aaron McLeran et Ken Jolly ont utilisé des techniques audio procédurales avancées pour créer une expérience auditive dynamique et immersive.
Ils ont utilisé une adaptation de Pure Data appelée libpd, une bibliothèque de synthèse audio intégrable conçue pour intégrer les puissantes capacités de Pure Data dans d'autres applications. Pure Data, pour ceux qui ne le savent pas, est un langage de programmation visuel à source ouverte pour le multimédia, qui est largement utilisé dans la création de musique et d'audio informatiques interactifs.
Libpd a permis à l'équipe de générer de la musique et des sons environnementaux en fonction de variables infiniment changeantes dans le jeu. Par exemple, lorsque les joueurs créaient et faisaient évoluer leurs créatures, les sons qu'elles émettaient étaient générés en temps réel et reflétaient leurs caractéristiques et comportements uniques.
Cette utilisation de l'audio procédural a permis à chaque joueur de vivre une expérience unique et personnelle avec le jeu.
No Man's Sky
No Man's Sky est un autre excellent exemple de la façon dont la conception sonore procédurale peut créer un univers de jeu riche et dynamique. L'équipe de développement a été confrontée à un défi unique : créer une bande sonore capable de s'adapter à l'univers généré de manière procédurale du jeu. La plupart des éléments du jeu, y compris les planètes, les écosystèmes et même les créatures, étant générés de manière algorithmique, une bande-son traditionnelle préenregistrée n'aurait pas suffi.
Pour relever ce défi, l'équipe de Hello Games a utilisé le middleware audio de Wwise, en particulier un plugin personnalisé connu sous le nom de VocAlien. Cet outil a été essentiel pour synthétiser les vocalisations des créatures diverses et uniques du jeu. VocAlien génère des sons basés sur les caractéristiques de chaque créature, telles que leur taille et leur type, garantissant que chaque son est approprié et unique.
Le système audio procédural du jeu a également permis aux créateurs de "produire" des sons. Cela signifie que les paysages sonores créés ne sont pas des enregistrements statiques, mais des pièces audio dynamiques qui changent en temps réel en fonction des animations et des comportements de base des créatures.
Par conséquent, les sons que vous entendez pendant l'exploration sont étroitement liés aux actions à l'écran et aux conditions environnementales.
Elite Dangerous
Elite Dangerous, le jeu d'exploration spatiale de science-fiction en ligne à succès de 2014, a placé la barre très haut en matière de son immersif dans les jeux vidéo grâce à son utilisation de la conception sonore procédurale. Les développeurs du jeu ont utilisé des techniques procédurales pour créer des sons dynamiques et adaptatifs, en particulier pour les moteurs des vaisseaux spatiaux et les interfaces graphiques.
Mini métro
Mini Metro est un jeu de simulation de métro minimaliste de 2015 qui utilise l'audio procédural pour créer une bande sonore adaptative et engageante qui améliore le gameplay. Les développeurs, Dino Polo Club, ont cherché à intégrer la musique procédurale dès le début, en tirant parti des forces des techniques procédurales pour s'adapter à la nature dynamique du jeu.
Rich Vreeland, le compositeur, a utilisé un système de musique procédurale qui réagit aux actions du joueur et à l'évolution du réseau de métro. Chaque ville du jeu possède ses propres qualités musicales, telles que les rythmes et les choix harmoniques, qui changent dynamiquement en fonction de la façon dont les joueurs construisent et modifient leurs lignes de métro.
Just Cause 4
Dans Just Cause 4, les développeurs ont utilisé la conception sonore procédurale pour l'effet sonore whoosh généré lorsque le joueur dépasse un véhicule NPC dans la circulation. Cet effet est créé à l'aide d'une synthèse en cours d'exécution à partir de l'intergiciel audio FMOD.
Cet effet sonore a été synthétisé à partir d'un mélange de bruit blanc et de bruit brun. Le bruit blanc a une intensité égale à différentes fréquences, ce qui crée un sifflement régulier, tandis que le bruit brun a plus d'énergie à des fréquences plus basses, ce qui produit un son plus profond et plus doux.
En mélangeant ces deux types de bruit dans des proportions différentes, l'équipe a pu faire varier la puissance du son combiné en fonction de plusieurs variables du jeu, telles que la distance par rapport aux véhicules des PNJ, la vitesse de ces véhicules et la vitesse du véhicule du joueur.
Grâce à cette approche, les effets sonores du moteur de jeu ont pu s'adapter dynamiquement aux actions du joueur et à l'environnement.
Réflexions finales - L'avenir de la conception sonore procédurale
Le son procédural offre une immense flexibilité dans les jeux modernes. Les concepteurs sonores peuvent créer des paysages sonores dynamiques et adaptatifs qui réagissent aux actions du joueur et aux changements environnementaux en temps réel, garantissant ainsi que l'expérience de chaque joueur est unique tout en renforçant l'immersion et l'engagement grâce à des effets sonores adaptés au contexte spécifique du jeu.
Cependant, malgré les avantages de l'audio procédural, l'audio échantillonné reste l'étalon-or pour obtenir la plus grande fidélité et le plus grand réalisme. Les échantillons préenregistrés capturent les détails nuancés et les caractéristiques naturelles des sons du monde réel, offrant ainsi un niveau de qualité audio inégalé. Pourquoi ne pas programmer quelques-uns des millions d'échantillons de tubes de l'épée disponibles dans les bibliothèques d'échantillons au lieu de synthétiser les vôtres ?
À l'avenir, les techniques procédurales continueront probablement d'évoluer et d'enrichir les méthodes traditionnelles de conception sonore. En intégrant la conception sonore procédurale à l'audio échantillonné, les créateurs de jeux seront en mesure d'exploiter les forces des deux approches pour créer des paysages sonores plus dynamiques et plus réalistes.