48kHz vs. 96kHz: Vilken ska man använda och varför?

48kHz vs. 96kHz: Vilken ska man använda och varför? 48kHz vs. 96kHz: Vilken ska man använda och varför?

Om du någonsin har tittat i dina DAW-inställningar och förfasat dig över de olika samplingsfrekvenser som erbjuds är du inte ensam. Vissa större DAW-program (Logic Pro och Pro Tools, till exempel) erbjuder sex samplingsfrekvenser att välja mellan: 44,1, 48, 88,2, 96, 176,4 och 192.

Om du inte känner till det så är samplingsfrekvensen den upplösning med vilken ljudet spelas in och, i fallet med virtuella instrument, produceras. Med tanke på detta skulle man kunna tro att större är bättre, eller hur?

Inte nödvändigtvis.

Även om de flesta diskussioner om samplingsfrekvenser handlar om gränserna för mänsklig hörsel, finns det några andra faktorer att ta hänsyn till när man väljer vilken samplingsfrekvens man ska spela in med.

Och det är där vi kommer in. Den här artikeln kommer att ta en djup (och jag menar, djup) dykning in i nollorna och ettorna i digitalt ljud. Komplex? På sina ställen, ja. Men i slutet av den här artikeln kommer du att känna till för- och nackdelarna med att spela in på 48kHz vs 96kHz och kunna bestämma vilken som är bäst för dig.

Förståelse för samplingsfrekvenser

Välja samplingsfrekvenser i Logic Pro

Föreställ dig att en bil kör förbi ditt hus. Den färdas från vänster till höger och förbi din grannes hus i en kontinuerlig rörelse. Det är motsvarigheten till ljud i den analoga världen - vågformen är ett kontinuerligt ljud.

Säg nu att du vill återskapa den bilen i rörelse. Du bestämmer dig för att göra en blädderboksanimation av fordonet som färdas från vänster till höger. Ju fler bilder du gör av bilens rörelse, desto mer detaljerad och jämn ser rörelsen ut.

Det är så digitalt ljud fungerar; det tar en serie bilder (eller samplingar) av den analoga vågformen i supersnabb hastighet för att återskapa den i den digitala världen.

Samplingsfrekvensen anger hur ofta dessa ögonblicksbilder tas varje sekund; en samplingsfrekvens på 44,1 kHz innebär att det tas 44 100 samplingar av den inkommande vågformen varje sekund. Högre samplingsfrekvenser resulterar i att fler ögonblicksbilder fångas. Men kan vi höra de extra detaljerna?

Nyquist-teoremet

Foto av Saad Ahmad på Unsplash

En smart ung kille vid namn Harry Nyquist upptäckte att samplingsfrekvensen måste vara minst dubbelt så hög som den högsta frekvens som spelas in. Detta kallas Nyquist-frekvensen eller Nyquist-gränsen.

Eftersom människan kan höra en maximal frekvens på cirka 20 kHz krävs en minsta samplingsfrekvens på 40 kHz för att fånga upp alla hörbara frekvenser.

Om man försöker spela in frekvenser över denna gräns uppstår aliasing eller foldover. De högre frekvenserna framställs felaktigt som lägre frekvenser, vilket leder till förvrängning eller artefakter i den rekonstruerade signalen.

Alla moderna digital-analog-omvandlare har antialiasing-filter som tar bort eventuella artefakter och fungerar som ett lågpassfilter som tar bort eventuella höga frekvenser som kan aliasas. Inspelning med högre samplingsfrekvenser ger utrymme för dessa filter att arbeta utan att klippa av några hörbara frekvenser.

Enkelt uttryckt är Nyquist-teoremet en "hur mycket är tillräckligt"-regel för digital inspelning.

Framväxten av ljud i CD-kvalitet

CD-kvalitetsstandarden på 44,1 kHz kom till i början av den digitala ljudtekniken, när hårddiskarna inte klarade av att lagra material motsvarande ett album och videobandspelare användes för ändamålet.

Baserat på bildfrekvensen och antalet användbara linjer per bildruta lagrade pennhuvudena 3 ljudsamplingar per bildruta, vilket resulterade i en samplingsfrekvens på 44,1 kHz. Detta var den lägsta möjliga samplingsfrekvensen som överensstämde med Nyquist-teorin och gjorde det möjligt att lagra mastern på videoband. Det blev det som vi nu kallar ljud i CD-kvalitet.

Fouriertransformation

Ett spektrogram i aktion!

Samplingsfrekvensen påverkar inte bara hur en signal fångas upp, utan även hur digitalt ljud "läses".

Fouriertransform är ett matematiskt verktyg som används för att analysera en komplex signal och bryta ner den till enkla vågformer med olika frekvenser. Det är så plugins som EQ, spektrogram och pitchdetektering fungerar, genom att analysera hela signalen och bryta ner den i mindre band.

Ju mer information en ljudfil innehåller i form av ögonblicksbilder per sekund (högre samplingsfrekvenser), desto mer exakta blir beräkningarna med fouriertransformationen.

Frekvenssvar

Foto av Saketh på Unsplash

En annan faktor att ta hänsyn till när man diskuterar samplingsfrekvenser är den utrustning som du spelar in och lyssnar på.

Alla ljudprylar har ett frekvenssvar, som ungefär kan beskrivas på följande sätt:

  • vilka frekvenser den kan återge, och
  • hur exakt den gör det.

Om du använder en usel Radioshack-mikrofon för att lägga ner en tagning på en usel gitarr och spelar upp den på ett par usla Radioshack-högtalare, är chansen stor att det inte kommer att låta bra. Oavsett vilken samplingsfrekvens du använder.

Ta mig högre

Efter att ha gått igenom allt det här vetenskapliga kan vi konstatera att högre samplingsfrekvenser gör att vi kan fånga upp högre frekvenser och analysera dem mer detaljerat.

Men även om inspelning med 96 kHz innebär att vi kan fånga upp frekvenser upp till 48 kHz, är det ur ett mänskligt lyssningsperspektiv ingen verklig hörbar skillnad mot en inspelning med 44,1 kHz. Även för personer med exceptionell hörsel kommer de övre frekvenserna fortfarande att ligga utanför det hörbara området.

Och tack vare Nyquist-teorin vet vi att 44,1 kHz är mer än tillräckligt för att återge alla signaler inom det mänskliga hörselområdet perfekt.

varför använder vi högre samplingsfrekvenser?

48kHz: Branschens standard

Foto av Thibault Penin på Unsplash

När det gäller film, TV och streaming har 48 kHz blivit den allmänt accepterade samplingsfrekvensen för leverans. Även om högre samplingsfrekvenser finns tillgängliga har 48 kHz säkrat sin plats som standard inom medieindustrin tack vare sin balans mellan kvalitet, effektivitet och kompatibilitet.

Varför är 48 kHz det bästa alternativet?

Det främsta skälet till att 48 kHz samplingsfrekvens infördes som standard inom medieproduktion var kompatibilitet. Samplingsfrekvensen passade bra ihop med de olika rambaserade videosystem som europeisk och NTSC-tv använder och uppfyllde samtidigt Nyquist-frekvenskraven.

Numera kräver streamingplattformar som Netflix, Disney och Amazon att ljudet levereras i 48 kHz, och även om du gör filmmusik till en gammaldags film som ska visas på biograferna måste du leverera 48 kHz-stems till mixningen.

Fördelar med att använda en 48 kHz samplingsfrekvens

Ett annat skäl till att 48 kHz har blivit en allmänt accepterad samplingsfrekvens är dess balans mellan bra ljud och bearbetningskrav.

Anti-liasing

Den något högre samplingsfrekvensen ger mer utrymme för antialiasingfilter att arbeta inom. Vid samplingsfrekvenser på 44,1 kHz kan ett inte helt perfekt antialiasingfilter ge upphov till subtila men mätbara artefakter.

Om man däremot använder samplingsfrekvenser på 48 kHz kommer eventuell aliasing att ligga utanför det hörbara spektrumet.

Ny provtagning

Med tanke på den utbredda användningen av den högre samplingsfrekvensen i mediebranschen minimeras behovet av omsampling när ljudet levereras med 48 kHz. Även om 44,1 kHz är vanligt i musikbranschen måste den färdiga produkten levereras med 48 kHz om du arbetar med synkroniserad licensiering.

Omvandlingsprocessen för samplingsfrekvensen vid uppsampling från lägre samplingsfrekvenser till 48 kHz kan leda till att oönskade artefakter introduceras i filen. Därför är det alltid en bra idé att spela in med en samplingsfrekvens av högre kvalitet och nedsampla senare om det behövs, t.ex. vid utskrift till CD.

Filstorlek

Inspelning och bearbetning av ljud vid 48 kHz gör att filstorlekarna blir hanterbara, vilket är viktigt för stora TV- och filmprojekt där lagringskostnader och dataöverföringstider är en viktig faktor.

Begränsningar vid användning av 48 kHz samplingsfrekvens

Det finns egentligen väldigt få begränsningar med att använda 48 kHz. Även om det finns en viss debatt inom ljudbranschen om huruvida det verkligen är "tillräckligt bra" för alla professionella tillämpningar, märks skillnaden mellan 48 kHz och en högre samplingsfrekvens ofta bara i mycket kontrollerade, avancerade lyssningsmiljöer.

96 kHz: Högupplöst ljud

AI-genererad - vänligen ersätt!

Även om 48 kHz samplingsfrekvens är branschstandard för film, TV, podcasts och liknande, föredrar vissa ingenjörer att arbeta med 96 kHz. De teoretiska fördelarna är bland annat större utrymme för att fånga upp högfrekvensinnehåll, minskad aliasing och förbättrade bearbetningsmöjligheter.

Teoretiska fördelar

Utökat inspelningsområde

En samplingsfrekvens på 96 kHz gör det möjligt att spela in frekvenser på upp till 48 kHz. Även om detta är långt bortom den mänskliga hörseln (som normalt når upp till cirka 20 kHz), hävdar vissa att detta ultrahöga frekvensinnehåll interagerar med ljudet på subtila sätt som människor fortfarande kan höra.

Reducerad aliasing

Minns du Nyquist-gränsen? Inspelning med 96 kHz flyttar den gränsen hela vägen upp till 48 kHz, vilket minskar risken för att aliasingartefakter ska störa det hörbara ljudet.

Bättre hantering av insticksprogram

Höga samplingsfrekvenser kan också resultera i bättre bearbetning för vissa effekter. Detta är särskilt märkbart när du tidsstretchar ljud eller utför pitch-shifting-uppgifter.

Att tidssträcka ljud som spelats in med högre samplingsfrekvenser ger ett renare ljud med en mer naturlig ljudkvalitet. Det är därför många ljuddesigners arbetar med en ännu högre samplingsfrekvens (192 kHz).

Detsamma gäller för bearbetning som mättnad och distorsion. Dessa plugins lägger till ytterligare högfrekvensinnehåll över den ursprungliga Nyquist-gränsen, så en 96 kHz samplingsfrekvens kommer att resultera i mindre möjlighet för aliasing att uppstå efter effekten.

Mer exakt mätning av provtoppar

En annan fördel med att arbeta med 96 kHz är den förbättrade noggrannheten vid mätning av samplets toppar. Ofta inträffar toppen av en signal mellan de sampel som har spelats in - så kallade intersample-toppar. En mixningstekniker får en mer exakt bild av var signaltopparna ligger med en högre samplingsfrekvens som innehåller fler samplingar per sekund.

Framtidssäkrad ljudkvalitet

En annan fördel med att spela in med 96 kHz är att man ligger steget före. I takt med att tekniken fortsätter att utvecklas kan högre samplingsfrekvenser bli normen, och vissa tekniker väljer 96 kHz för att säkerställa kompatibilitet med framtida högupplösta format.

Nackdelar med att använda en 96 kHz samplingsfrekvens

Inspelning med 96 kHz har många teoretiska fördelar och kan resultera i bättre ljudkvalitet vid tidsförskjutning och redigering. Men dessa fördelar kommer med praktiska kompromisser jämfört med att använda en lägre samplingsfrekvens.

Filstorlek

Varje gång du fördubblar en samplingsfrekvens fördubblas också mängden data som genereras. En session som spelas in med 96 kHz tar upp dubbelt så mycket utrymme som en 48 kHz-session på grund av de mycket större filer som skapas.

För komplexa projekt kan detta snabbt öka lagringskraven och göra säkerhetskopiering, delning och filhantering mer utmanande.

Processorkraft

Som du kan förvänta dig kräver en högre samplingsfrekvens mer juice från din CPU. Såvida du inte har en superjazzad maskin kan du upptäcka att din session lider av ökad latens, långsammare renderingstider och systeminstabilitet.

DAW-prestanda

De flesta DAW:er stöder högre samplingsfrekvenser, men om du kör en session med 96 kHz eller högre innebär det att DAW:n måste arbeta hårdare för att strömma ljudet. Beroende på ditt system och hur komplex sessionen är finns det en ökad risk för avbrott eller störningar. Inte idealiskt när du mixar din nästa banger.

Plugin-prestanda

Vissa plugins översamplar den inkommande signalen internt för att förbättra kvaliteten på resultatet, t.ex. mätningsplugins eller limiters. Att köra dem med en redan hög samplingsfrekvens kan försämra CPU-prestandan.

Effektivitet i arbetsflödet

Även om högre samplingsfrekvenser kan ge teoretiska fördelar och framtidssäkerhet, kan en session med högre frekvenser göra arbetsflödet långsammare utan några märkbara fördelar.

  • Vissa budgetaudiogränssnitt klarar inte 96 kHz samplingsfrekvens, vilket kan leda till distorsion i ljudet.
  • Du kommer nästan alltid att behöva nedsampla för att skapa slutresultat, vilket skapar onödiga konverteringssteg på vägen.
  • Om ditt system har problem med att köra en session med högre samplingsfrekvens kommer det oundvikligen att ta längre tid. Mixningen blir tråkig, och du måste fortfarande nedsampla efteråt.

Kan vi höra skillnaden mellan 48 kHz och 96 kHz?

Foto av Mark Paton på Unsplash

Den stora frågan i den här diskussionen är: Kan människor verkligen höra skillnaden mellan 48 kHz och 96 kHz?

Det beror på vem du frågar.

Vissa tränade lyssnare, särskilt masteringstekniker och audiofiler, hävdar att de kan höra subtila skillnader mellan samplingsfrekvenser, särskilt om det är ett instrument som de är mycket anpassade till.

En del menar att även om vi inte kan höra skillnaden mellan de två samplingsfrekvenserna, så kan förekomsten av ultraljud i ljudet påverka lyssningsupplevelsen på grund av harmonisk interaktion.

Huruvida detta beror på faktiska ljudskillnader eller bara en psykologisk fördom kan diskuteras. Men det finns ett par saker som påverkar hur vi hör ljud.

Uppspelningssystem

Minns du diskussionen om frekvensrespons? Även om du har övermänsklig hörsel, långt bortom 20 kHz-området, blir den högre samplingsfrekvensen i praktiken värdelös om högtalarna du lyssnar på inte stöder dessa ultraljudsfrekvenser.

Begränsningar i människans hörsel

De flesta vuxna upplever en försämring av de övre delarna av hörseln när de åldras. Även om de ultrahöga frekvenserna finns med i ett ljud är risken stor att många lyssnare ändå inte skulle kunna höra dem.

Praktiska överväganden

Vi kan koka ner den här diskussionen till två idéer:

  • 48 kHz är standard i mediebranschen och uppfyller alla ljudkrav.
  • 96 kHz verkar ganska coolt, men kommer också med en hel del bagage.

Att välja rätt samplingsfrekvens för ditt projekt beror på dina specifika behov och ditt arbetsflöde. Här är en praktisk uppdelning för olika områden inom ljudproduktion.

Musikproduktion: Inspelning, mixning och mastering

När du arbetar med enbart musik handlar valet av samplingsfrekvens om att balansera ljudkvalitet med systemeffektivitet.

  • Inspelning: Vissa tekniker vill spåra med höga samplingsfrekvenser på 96 kHz eller högre för att fånga varje ljuddetalj och för att förhindra aliasingfel. För den mesta musiken är dock 48 kHz mer än tillräckligt, och det är mindre ansträngande för systemets kapacitet och lagringsutrymme. Dessutom behöver du inte använda en masterklocka för att hålla allt synkroniserat.
  • Mixning & Mastering: Många plugins har numera intern översampling för att ge en mer exakt utdata, så att arbeta med 48 kHz ger fortfarande en hög ljudstandard.
  • Slutleverans: Streamingplattformar brukar acceptera filer med en samplingsfrekvens på antingen 44,1 eller 48 kHz. Om musiken ska återges på CD behöver den slutliga mixen omvandlas till 44,1 kHz. I vilket fall som helst är inspelning med höga samplingsfrekvenser överflödigt i dessa situationer.

Film & TV Ljud

När man arbetar med film och TV (inklusive synklicensiering ) är 48 kHz guldstandarden. I de flesta fall måste bitdjupsupplösningen vara 16 bitar, även om det är en bra idé att spela in med ett bitdjup på 24 till att börja med och dither ner för leverans.

Med tanke på det höga antalet spår som förekommer i postproduktionssessioner kan inspelning med 96 kHz innebära problem med systemeffektivitet och lagringsutrymme.

Spel & VR

Ljud i spel och virtual reality-scenarier kräver ofta högre samplingsfrekvenser på grund av formatets unika krav.

Ofta krävs omfattande tidsstretching och pitch shifting av ljud, så det är bättre att spela in med 96 kHz.

Live-ljud och streaming

I livesituationer är realtidsprestanda högsta prioritet, vilket gör 48 kHz till det bästa valet.

Slutliga rekommendationer

Som en allmän tumregel kan sägas att det mest effektiva sättet att spela in ljud är med ett bitdjup på 24 och en samplingsfrekvens på 48 kHz.

De här inställningarna är ett mellanting mellan ljudklarhet och effektivitet när det gäller lagring och CPU-prestanda.

Många plugins utför redan intern översampling när de arbetar med dessa hastigheter, vilket innebär att fördelarna med att spela in vid 96 kHz är försumbara.

Dessutom kompenserar högkvalitativa digitala limitrar och mätare för toppar mellan samplingar, vilket minskar behovet av högre samplingsfrekvenser.

Slutligen är 48 kHz en branschstandard för de flesta professionella arbeten, vilket säkerställer sömlös integration med samarbetspartners och distributörer.

De få situationer där det kan vara värt att överväga att använda 96 kHz för inspelning är när:

  • ett projekt kräver omfattande tidsstretching, pitch shifting eller redigering (t.ex. granulär syntes).
  • ett projekt är för arkivändamål och du vill framtidssäkra arbetet.

Slutsats

Vi har hunnit med mycket! Här är en snabb sammanfattning av vad som har behandlats. Klippanteckningarna, om du så vill:

  • En samplingsfrekvens på 44,1 kHz kan perfekt återge ljudsignaler upp till de högsta frekvenserna inom det mänskliga hörselområdet.
  • Inom TV-, film- och mediebranschen används 48 kHz som standard.
  • Inspelning med 96 kHz kräver mer processorkraft och mer diskutrymme för att lagra de större filer som blir resultatet.
  • Att använda allt högre samplingsfrekvenser leder till minskande avkastning i förhållande till systemeffektivitet och lagringskostnader.
  • Om du vet att du kommer att använda time-stretching och andra redigeringsfunktioner på ljudet bör du spela in med 96 kHz för att få bättre resultat.

Kom ihåg att det sammanhang du arbetar i är viktigare än att jaga siffror.

Om du är artist kanske din publik inte bryr sig om att du har producerat ett spår på 96 kHz. Faktum är att det är osannolikt att de skulle höra skillnaden mellan det och något som spelats in på 44,1 kHz.

Om du spelar in musik för film och TV är 48 kHz den perfekta avvägningen mellan ljudkvalitet och professionell standard.

Och om du bygger upp ett bibliotek med ljud för ett effektbibliotek är det 96 kHz som gäller för att du ska få maximal redigeringsmöjlighet.

I slutändan är det ditt samtal. Experimentera med olika samplingsfrekvenser och se vad du tycker låter bra. Om du hör en märkbar skillnad vid 96 kHz, kör på det! (Men köp kanske en större hårddisk ...).

Oavsett vilken du kommer att använda, gå ut och gör musik!

Ge dina låtar liv med professionell mastering, på några sekunder!