Procedural Audio: Den kompletta nybörjarhandboken

Procedural Audio: Den kompletta nybörjarhandboken Procedural Audio: Den kompletta nybörjarhandboken

Har du någonsin lagt märke till hur du, när du är djupt inne i ett spel, hör alla möjliga ljud, som fotsteg, explosioner och omgivande ljud, som alla verkar perfekt tajmade till dina handlingar? De flesta av dessa ljud är förinspelade ljudsamplingar som skapats av begåvade ljuddesigners.

Dessa små ljudsnuttar finns också i många olika former, inklusive enstaka ljud, som ett pistolskott, eller slingor, som det konstanta brummandet från ett rymdskepps motor. Men vad du kanske inte visste är att inte alla ljud i videospel kommer från förinspelade samplingar. Vissa ljud skapas direkt när du spelar spelet.

Det här är vad vi kallar procedurljud, som jag vill se som spelets personliga lilla kompositör. Med det kan vi skapa ljud dynamiskt under spelets gång utan att förlita oss på förrenderade ljudfiler. Det innebär att ljudet du hör när en karaktär trampar på grus kan vara lite annorlunda varje gång, vilket gör att spelet känns ännu mer uppslukande och realistiskt.

I den här guiden ska vi ta en titt på allt som finns att veta om procedurljud, inklusive dess historia, hur det fungerar och några coola exempel på hur det används i moderna spel.

Så oavsett om du är en blivande ljuddesigner eller bara nyfiken på tekniken bakom dina favoritspel, häng kvar! Vi har mycket att berätta.

Vad är procedurellt ljud?

Procedurljud är en fascinerande aspekt av ljuddesign för spel. Tanken är att skapa ljud under spelets gång eller generera ljud i farten, precis när du spelar spelet, i stället för att spela in det i förväg och sedan spela upp det.

Procedurell ljuddesign skapar ljudeffekter som baseras på förutbestämda beteenden. Tänk på det som ett system som vet hur det ska generera ett fotstegs-ljud när din karaktär går på olika ytor utan att behöva ett förinspelat sample för varje steg. Istället syntetiseras ljudet i realtid, vilket gör varje fotsteg lite unikt.

Den här tekniken liknar den procedurella generering som används i andra delar av spel, som miljökonst och nivådesign. Precis som ett spel kan skapa en ny skog eller en ny fängelsehåla varje gång du spelar, skapar procedurljud ljudlandskap som du hör baserat på spelets aktuella tillstånd och dina interaktioner.

Genom att använda procedurljud kan ljuddesigners skapa djupt integrerade ljudlandskap som reagerar på spelarens handlingar och spelmiljön på ett sammanhängande och trovärdigt sätt.

Det finns dock vissa nackdelar med att använda vanliga procedurtekniker för ljuddesign.

En stor utmaning är komplexiteten i att säkerställa att ljuden är av hög kvalitet och realistiska. Att skapa övertygande procedurljud kan vara mer tekniskt krävande än att använda förinspelade samplingar. Dessutom kan det kräva mer CPU, vilket kan påverka spelets prestanda, särskilt på mindre avancerade system.

En historia av procedurell ljuddesign

I spelvärldens barndom var procedurell ljuddesign inte bara en konstform. Det var en nödvändighet för ljudet. Det begränsade RAM-minnet i tidiga spelsystem kunde inte hantera lagringskraven för förinspelade ljudsamplingar, alternativet till procedurljud. Denna begränsning tvingade utvecklarna att generera ljud i realtid medan spelet spelades.

Ljud i spel började med det ikoniska spelet Pong på Magnavox Odyssey 1972. Intressant nog levererades den ursprungliga Magnavox Odyssey inte med något ljud alls. Det var Atari-versionen av Pong som blev historisk genom att integrera ljud. Atari gjorde detta genom att använda Television Interface Adapter (TIA), en hårdvara som var utformad för att hantera både video- och ljudutgångar.

TIA kunde generera ljudvågor med hjälp av två oscillatorer. Genom att manipulera dessa oscillatorer kunde Atari-versionen av Pong skapa ett enkelt men effektivt ljud, vilket var det första exemplet på procedurell ljuddesign i spel.

I spelet fanns det tre primära ljud, vart och ett genererat procedurmässigt:

  • Det första ljudet var pipet när bollen träffade paddlarna, vilket gav spelarna omedelbar ljudåterkoppling på sina träffar
  • Det andra ljudet var ett djupare pong-ljud när bollen kolliderade med väggarna, vilket skiljde det från paddelträffar.
  • Det tredje ljudet var ett högre ljud för poängräkning, vilket signalerade att en poäng hade uppnåtts.

Även om dessa ljud är enkla med dagens mått mätt, tillförde de ett nytt lager av engagemang och feedback som var avgörande för spelets uppslukande upplevelse.

I takt med att tekniken utvecklades ökade naturligtvis även komplexiteten och kvaliteten på procedurljudet.

Utvecklingen av procedurljud

I slutet av 1970-talet började procedurljudet ta form på olika spelkonsoler. Tre anmärkningsvärda system från den här tiden var Atari 2600, Fairchild Channel F och Bally Astrocade. Var och en av dessa konsoler använde procedurljud för att förbättra spelupplevelsen inom ramen för hårdvarans begränsningar.

Utvecklingen under 1980-talet flyttade fram gränserna för spelljud ytterligare.

År 1983 introducerade Vectrex en ny nivå av ljudsyntes, medan Nintendo gjorde betydande framsteg med lanseringen av Nintendo Entertainment System (NES) 1985. NES hade ett femkanaligt ljudsystem med stöd för ett bredare frekvensområde från 54Hz till 28kHz och kunde utföra pitch bends. Ikoniska spel som Super Mario Bros. satte en standard för procedurljud med minnesvärda ljud som "ping" från myntsamlingen, "svamp"-ljudet från power-ups och "hopp"-effekten.

1986 kom Sega Master System som innebar en ännu större utveckling av spelljudet. Det innehöll både sampling och elektronisk syntes och använde fyra ljudkanaler (tre för musik och en för ljudeffekter). Master System var utrustat med YM2413-chipet från Yamaha, samma chip som används i deras professionella synthesizers, vilket avsevärt förbättrade kvaliteten och komplexiteten i de ljud som kunde produceras.

Utvecklingen fortsatte med lanseringen av Sega Mega Drive (Genesis) 1988 och Super Nintendo Entertainment System (SNES) 1990. Båda dessa konsoler introducerade mer sofistikerade ljudfunktioner, inklusive samplingar av högre kvalitet och fler kanaler för fylligare ljudlandskap.

Det var dock inte förrän Sega Saturn släpptes 1994 som vi fick se en annan viktig milstolpe i utvecklingen av spelljud. Den innehöll ett ljudchip och en ljudprocessor som kunde hantera upp till 16 ljudkanaler med 44,1 kHz CD-kvalitet, vilket banade väg för det högkvalitativa ljud vi förväntar oss i moderna spel.

Förinspelade ljudeffekter och musik

År 1994 upplevde spelvärlden en monumental förändring i och med lanseringen av Sonys PlayStation. Konsolen innebar en betydande uppgradering av ljudfunktionerna, med en samplingsfrekvens på 44,1 kHz och 24 kanaler med stereoljud. PlayStations ljudchip förändrade spelvärlden och gav möjlighet till reverbeffekter och looping.

Med den nyvunna flexibiliteten kunde kompositörer och ljuddesigners skapa mer komplexa och uppslukande ljudlandskap för att berika varje spelares upplevelse.

Före PlayStation-eran krävdes en djup förståelse för ljudprogrammering och procedurellt ljud för att skapa ljud till spel. De som skapade ljuden behövde vara väl insatta i komplex kodning och signalbehandling för att generera och implementera ljudeffekter och musik. Detta gjorde processen mycket arbetsintensiv och begränsade ofta kreativiteten hos dem som var mer musikaliskt lagda men mindre tekniskt kunniga.

PlayStation revolutionerade på många sätt den här processen genom att göra det möjligt att enkelt implementera förinspelade ljudeffekter och musik i spel. Kompositörer och ljuddesigners behövde inte längre bekymra sig om hur komplicerat det var med procedurljud. Istället kunde de fokusera på att skapa högkvalitativa ljudeffekter och musik, som de sedan kunde skicka vidare till utvecklarna för integrering i spelet.

Är Procedural Audio omodernt?

Trots ökningen av förinspelade ljudeffekter och musik är procedurljud långt ifrån omodernt. Många post-PlayStation-spel fortsätter att utnyttja de matematiska modellerna för procedurljud. Låt oss ta en titt på några av de mest populära.

Moderna spel som använder procedurellt ljud

Spore

I det banbrytande spelet Spore från 2008 använde ljudprogrammerarna Aaron McLeran och Ken Jolly avancerad procedurell ljudteknik för att skapa en dynamisk och omslutande ljudupplevelse.

De använde en anpassning av Pure Data som heter libpd, ett inbäddningsbart ljudsyntesbibliotek som är utformat för att integrera Pure Datas kraftfulla funktioner i andra applikationer. Pure Data, för dem som inte vet det, är ett visuellt programmeringsspråk för multimedia med öppen källkod som används flitigt för att skapa interaktiv musik och ljud i datorer.

Libpd gjorde det möjligt för teamet att generera musik och miljöljud baserat på oändligt föränderliga variabler i spelet. När spelarna skapade och utvecklade sina varelser genererades till exempel ljuden i realtid, vilket återspeglade varelsernas unika egenskaper och beteenden.

Denna användning av procedurljud säkerställde att varje spelare fick en unik och personlig upplevelse av spelet.

No Man's Sky

No Man's Sky är ett annat utmärkt exempel på hur procedurell ljuddesign kan skapa en rik och dynamisk spelvärld. Utvecklingsteamet stod inför den unika utmaningen att skapa ett soundtrack som kunde anpassas till spelets procedurellt genererade universum. Eftersom de flesta av spelets tillgångar, inklusive planeter, ekosystem och till och med varelser, genereras algoritmiskt skulle ett traditionellt förinspelat soundtrack inte räcka till.

För att klara den här utmaningen använde teamet på Hello Games Wwise audio middleware, särskilt ett anpassat plugin som kallas VocAlien. Detta verktyg var avgörande för att syntetisera vokaliseringar för spelets olika och unika varelser. VocAlien genererar ljud baserat på varje varelses egenskaper, t.ex. storlek och typ, vilket säkerställer att varje ljud är lämpligt och unikt.

Det procedurella ljudsystemet i spelet gjorde det också möjligt för skaparna att i princip "framföra" ljud. Det innebär att de ljudlandskap som skapas inte är statiska inspelningar utan dynamiska ljudstycken som förändras i realtid baserat på varelsernas basanimationer och beteenden.

Som ett resultat är ljuden du hör när du utforskar intrikat kopplade till händelserna på skärmen och miljöförhållandena.

Elite Dangerous

Elite Dangerous, 2014 års megasuccé bland onlinespel med sci-fi-rymdutforskning, satte en hög ribba för uppslukande ljud i spel med sin användning av procedurell ljuddesign. Spelets utvecklare använde sig av procedurtekniker för att skapa dynamiska och anpassningsbara ljud, särskilt för rymdskeppsmotorer och grafiska gränssnitt.

Mini Metro

Mini Metro är ett minimalistiskt tunnelbanesimuleringsspel från 2015 som använder procedurellt ljud för att skapa ett anpassningsbart och engagerande soundtrack som förbättrar spelet. Utvecklarna, Dino Polo Club, strävade efter att integrera procedurell musik från början och utnyttja styrkan i procedurella tekniker för att matcha spelets dynamiska natur.

Kompositören Rich Vreeland använde sig av ett procedurellt musiksystem som reagerar på spelarens handlingar och på hur tunnelbanesystemet utvecklas. Varje stad i spelet har sin egen uppsättning musikaliska kvaliteter, till exempel rytmer och harmoniska val, som förändras dynamiskt beroende på hur spelarna bygger och ändrar sina tunnelbanelinjer.

Just Cause 4

I Just Cause 4 använde utvecklarna procedurell ljuddesign för whoosh-ljudeffekten som genereras när spelaren passerar ett NPC-fordon i trafiken. Denna effekt skapas med hjälp av runtime-syntes från FMOD audio middleware.

Denna whoosh-ljudeffekt har syntetiserats med hjälp av en blandning av vitt och brunt brus. Vitt brus innehåller lika mycket intensitet vid olika frekvenser, vilket skapar ett konsekvent väsande ljud, medan brunt brus har mer energi vid lägre frekvenser, vilket ger ett djupare, mjukare ljud.

Genom att blanda dessa två typer av ljud i olika proportioner kunde teamet variera ljudstyrkan i det kombinerade ljudet baserat på flera variabler i spelet, t.ex. avståndet till NPC-fordon, hastigheten på dessa fordon och hastigheten på spelarens fordon.

Med detta tillvägagångssätt kunde ljudeffekterna i spelmotorn anpassas dynamiskt till spelarens handlingar och miljön.

Avslutande tankar - Framtiden för procedurell ljuddesign

Procedurellt ljud erbjuder en enorm flexibilitet i moderna spel. Ljuddesigners kan skapa dynamiska och anpassningsbara ljudlandskap som svarar på spelarens handlingar och miljöförändringar i realtid, vilket säkerställer att varje spelares upplevelse är unik samtidigt som det ökar inlevelsen och engagemanget genom att tillhandahålla ljudeffekter som är skräddarsydda för det specifika sammanhanget i spelet.

Men trots fördelarna med procedurljud är samplade ljud fortfarande guldstandarden för att uppnå högsta möjliga återgivning och realism. Förinspelade samplingar fångar de nyanserade detaljerna och de naturliga egenskaperna hos verkliga ljud, vilket ger en oöverträffad ljudkvalitet. Varför inte bara programmera några av de miljontals samplingar av swordhits som finns i samplingsbibliotek i stället för att syntetisera dina egna?

I framtiden kommer procedurtekniker sannolikt att fortsätta utvecklas och komplettera traditionella ljuddesignmetoder. Genom att integrera procedurell ljuddesign med samplat ljud kommer spelskapare att kunna utnyttja styrkorna i båda metoderna för mer dynamiska och realistiska ljudlandskap.

Ge dina låtar liv med professionell mastering, på några sekunder!