Ljudfilsformat: Den ultimata guiden

Ljudfilsformat: Den ultimata guiden Ljudfilsformat: Den ultimata guiden

Ljudfilformat är på atomnivå i musikproduktionen.

När du skapar ljud som ska skickas ut till en streamingplattform eller brännas på en CD måste du lagra det på något sätt.

Med så många olika typer av ljudfilformat kan det naturligtvis vara svårt att veta vilket du behöver använda i just din situation.

Frågan blir då,

Vilket ljudfilformat behöver du använda för att säkerställa att din ljudkvalitet blir så bra som möjligt?

I den här korta guiden kommer vi att diskutera allt du behöver veta om ljudformatstyper så att du kan välja rätt för det aktuella jobbet.

Låt oss dyka in!

Vad är ljudfilformat?

Du kan se ett ljudfilformat som ett lagringsutrymme för ljudinformation.

När råa ljuddata skickas ut från ditt ljudgränssnitt genom analog-till-digital-omvandlaren använder ditt gränssnitt pulskodmodulering (PCM) för att koda dem.

För att kunna spela upp pulskodmoduleringen med ett fysiskt system måste du organisera informationen till en spelbar fil.

Du kan skilja på ljudfilformatstyper genom de behållare de finns i och de datakomprimeringsmetoder de använder för att hålla PCM-strömmarna i ordning.

Även om dessa olika format representerar samma information är kvalitetsnivåerna och lagringsutrymmet olika.

Vissa ljudformat har till och med unika egenskaper, till exempel metadatalagring, som ger innehålls- eller filinformation.

En djupdykning i PCM

PCM

PCM, eller pulskodmodulering, är som sagt den metod som används för att omvandla analoga signaler till signaler som kan användas i den digitala domänen. Denna omvandlingsprocess kodar vågformer med bitdjup och samplingsfrekvens. Bitdjupet är antalet bitar per sampel, medan samplingsfrekvensen är antalet sampel per sekund.

De flesta digitala format har en samplingsfrekvens på 24-bitars/44,1 kHz.

De 3 huvudgrupperna av ljudformat

Det enklaste sättet att tänka på ljudformat och hur de skiljer sig från varandra är att dela in dem i tre huvudgrupper:

  • Okomprimerat ljudformat
  • Förlustkomprimerat ljudformat
  • Förlustfritt komprimerat ljudformat

Kolla in tabellen nedan, som kopplar varje av de viktigaste ljudformaten till dess kodningstyp:

Typer av ljudkodning

Förlorade ljudfiler mot förlustfria ljudfiler

Förlustfri

I den stora världen av ljudfiler hittar du förlustfria och förlustfria filformat, som skiljer sig åt när det gäller datakomprimering.

Vi använder datakomprimering som ett praktiskt verktyg för att få plats med fler filer på en hårddisk. Du kan tänka på det som att zippa ett antal enskilda filer på din dator för att få en mindre fil att lagra. Den här typen av komprimering skiljer sig mycket från komprimerat ljud vid mixning eller musikproduktion.

I motsats till vad många tror finns det datakomprimeringsmetoder som kan göra filer mindre samtidigt som informationen i ljudströmmen bevaras i sin helhet. Vi kallar dessa ljudformat för förlustfritt komprimerade format.

Å andra sidan finns det komprimerade format med förlust, som eliminerar data i ljudströmmen utan att ljudet påverkas nämnvärt. Det finns dock information som kastas ut med den här typen av komprimeringsmetod.

Komprimerade ljudformat jämfört med okomprimerade ljudformat

Ljudformat utan någon form av komprimering kallas okomprimerade ljudformat.

Det här är behållare som lagrar rå ljuddata utan någon form av kvalitets- eller storleksreducering. Även om dessa filer kan vara mycket större än komprimerade ljudfiler, ger de mest detaljer och ljudåtergivning.

Du hittar ofta den här typen av filer som används för olika steg i musikproduktionen, till exempel inspelning eller mixning.

Trots detta är inte alla okomprimerade ljudfiler likadana. Du hittar varierande kvalitetsnivåer i dessa filer beroende på hur den analoga signalen har konverterats digitalt. Olika typer av analog-till-digital-omvandlare använder olika nivåer av precision och noggrannhet.

När du använder ett högre bitdjup och en högre samplingsfrekvens under konverteringsprocessen kan du fånga mer information.

Bitdjupet är antalet informationsbitar i ett ljudprov, vilket direkt hänvisar till varje provs upplösning. På en CD används t.ex. 16 bitar per sampel, medan ljudet på en DVD använder 24 bitar per sampel.

Det är den exakthet med vilken en analog-till-digital-omvandlare kan mäta amplitud eller signalvolym som ger bitdjupet.

Jag brukar ofta tänka på bitdjupet som de små markeringarna på ett måttband. Lägre bitdjup kan vara tummarkeringarna, som sitter mycket längre ifrån varandra, medan högre bitdjup kan vara centimetermarkeringarna. I grund och botten tar ett högre bitdjup hänsyn till ett större antal mindre, individuella mätningar.

Förståelse av bithastighet

Bitrate är den mängd data som produceras av en fil varje sekund.

När du lyssnar på digitalt ljud kommer du att se filer som har en "kbps"-markering i slutet för att berätta vilken bithastighet som är associerad med den.

Varje sekund av en ljudinspelning innehåller ett bestämt antal bitar. Vi beräknar dessa bitar med "data per sekund". Om du till exempel ser en ljudfil som har "280 kbps" betyder det att det finns 280 kilobitar i varje sekund av ljudet i den strömmen.

Vi använder bitrate, som är den mängd data som kodas varje sekund, för att bestämma kvaliteten på ett filformat.

Även om du får mindre komprimerade filer med lägre bitrate-inställningar är ljudkvaliteten inte lika hög. När hårddiskar först kom till var det nödvändigt att ha ljud med låg bithastighet, eftersom vi inte hade den typ av lagringskapacitet som vi har nu. Detsamma gällde för de flesta datorer, som inte hade bandbredd nog för att överföra större filer.

I den moderna digitala världen är bandbredd och lagring inget vi behöver oroa oss för, vilket är anledningen till att det alltid rekommenderas att du använder högsta möjliga bithastighet när du arbetar med lossy-format.

Om du t.ex. arbetar med en MP3-fil är standarden för hög kvalitet 320 kbps. Med dessa avancerade inställningar kan det vara ganska svårt att skilja komprimerat ljud från okomprimerat ljud när man lyssnar tillfälligt.

Förståelse för högupplöst ljud

Nu kanske du undrar,

Hur är det med högupplöst ljud?

Högupplöst ljud är ganska unikt eftersom det inte finns någon enskild standard för det.

Men när producenter och tekniker talar om högupplöst ljud syftar de ofta på ljudfiler med samplingsfrekvenser eller bitdjup som överstiger CD-standarden, som är 16-bitars/44,1 kHz.

I våra ögon är högupplösta filer 24-bit/48kHz, 24-bit/96kHz och 24-bit/192kHz.

Det fina med högupplösta ljudfiler är att de innehåller mycket mer information än lågupplösta filer eller komprimerat ljud, vilket innebär att ljudkvaliteten är mycket bättre. Högupplöst ljud tar upp mer lagringsutrymme, men det kan vara värt det om kvaliteten är det du är ute efter.

Några av de mest populära okomprimerade högupplösta ljudfilerna är WAV och AIFF, men det finns även FLAC- och ALAC-ljudformat.

Vanliga ljudfilsformat

Det finns flera olika ljudfilformat, men alla är inte supervanliga.

Under din allmänna musikproduktionsresa kommer du sannolikt bara att stöta på några få olika ljudformatstyper. Här är några av de viktigaste som du bör känna till:

MP3

Det vanligaste ljudformatet för avslappnad lyssning är MP3.

I början av 2000-talet blev Mp3-filer allt populärare, mycket tack vare den fildelningsrevolution som Napster startade. I oktober 2001 drog Steve Jobs upp en liten enhet ur fickan med 1 000 av dessa filer på.

Det som var så fantastiskt med MP3-filer var hur mycket information vi kunde lagra i så små behållare med bibehållen ljudkvalitet.

En av anledningarna till att MP3-filer hamnade i centrum för illegal nedladdning av musik var förstås att de var lätta att koda från CD-skivor.

I dagens värld är MP3 fortfarande en av de vanligaste ljudfilformattyperna. Även stora digitala ljudnedladdningsbutiker som Bandcamp använder fortfarande MP3-filer som sitt huvudformat.

De är några av de mest praktiska filerna för att lagra musik på surfplattor eller bärbara uppspelningsenheter. Dessutom fungerar MP3-filer på i stort sett alla uppspelningsenheter.

Den bithastighet som MP3-filer spelas in med kan ha stor betydelse för ljudkvaliteten. Till exempel kommer en MP3 med 128 kbps-kodning att ha sämre ljudkvalitet än en MP3 med 320 kbps-kodning.

Titta nedan för att få en uppfattning om storleken på MP3-filer jämfört med andra filtyper:

Jämförelse av filstorlek

FLAC/ALAC/WMA

FLAC-filer är förlustfritt komprimerade ljudfiler med öppen källkod. Detta ljudfilformat var ett av de allra första förlustfria formaten som började användas i stor skala. FLAC står för Free Lossless Audio Codec. De här filerna är ungefär hälften så stora som en vanlig WAV- eller AIFF-fil med samma samplingsfrekvens.

Du får dock ingen förlust i ljudkvalitet med FLAC-filer. De är bättre än CD-kvalitet, eftersom de ger upp till 32-bitars / 96 kHz upplösning.

Det fina med FLAC-filer är att de gör det möjligt för användare med begränsat lagringsutrymme på sina lyssningsenheter att njuta av förlustfritt ljud. Även om det kan vara svårt för den genomsnittliga lyssnaren att se skillnaden mellan FLAC och MP3, är många audiofiler snabba med att diskutera skillnaderna.

ALAC är mycket lik FLAC, även om den utvecklades av Apple. Den här filtypen står för Apple Lossless Audio Codec.

ALAC är ett bra alternativ till FLAC för Apple Music- eller iOS-användare. Observera dock att ALAC-filer är något större än FLAC-filer.

Windows-alternativet är WMA, som står för Windows Media Audio. Detta alternativ har utvecklats av Microsoft för operativsystemet Windows. WMA kan hantera upp till 24-bit/96kHz samplingsfrekvenser och återger dem utan att ta bort data.

Observera att Windows också har utvecklat ett WMA-förlustformat, som kan vara värt att överväga om du har en Windows-dator och vill minska filstorlekarna samtidigt som du får högre ljudåtergivning än MP3.

AAC

AAC-filer är komprimerade ljudfiler med förlust som skapades av ett antal företag inom digital teknik, bland annat Bell, Microsoft och Dolby. Tanken bakom skapandet av AAC-ljudfilformatet är att det ska vara mer effektivt än MP3.

Om du någonsin har ägt en iPod har du lyssnat på AAC-ljudfilformatet tidigare, eftersom iTunes Store använder AAC-filer.

AAC är lite mer effektivt än MP3 och många tycker att det låter bättre. Det används för Apple Musics streamingplattform och för YouTubes streamingplattform.

WAV/AIFF

WAV-filer (Waveform Audio File Format) är ett av de vanligaste förlustfria, okomprimerade ljudformaten som finns. Människor använder ofta AIFF-filer i stället för WAV-filer också, eftersom båda dessa filtyper har samma mängd information som finns på dem. I huvudsak fungerar de mycket likartat.

Båda dessa filer är baserade på PCM eller pulskodmodulering, som är en av de enklaste metoderna för lagring av ljud i den digitala världen.

Skillnaden är att WAV-filer utvecklades för PC-användare av IBM och Microsoft, vilket är anledningen till att du hittar dem på Windows-baserade plattformar. WAV är också standardkodningsformatet för CD-skivor.

Å andra sidan utvecklades AIFF-filer (Audio Interchange File Format) för Apple-användare som WAV-alternativ. De används inte lika ofta som WAV-filer, men de har mycket bättre stöd för metadata. Till skillnad från en WAV-fil kan du inkludera data som låttitlar och konstverk på AIFF-filer.

AIFF-filer använder pulskodmodulering, vilket innebär att de inte komprimeras eller förlorar information på vägen. Om du spelar in i Logic kanske du märker att AIFF är ett av de få val du har.

Naturligtvis kan du använda båda formaten på varje plattform.

Den största nackdelen med båda dessa typer av filer är att de är mycket stora. En 16-bitars/44,1 kHz CD-kvalitetsfil tar upp cirka 10 MB utrymme i genomsnitt för varje minut av ljud.

Med det sagt är de två filerna det självklara valet för ljudtekniker som vill ha ljud som håller högsta ljudkvalitet.

OGG Vorbis

OGG Vorbis-filer, ofta kallade Vorbis-formatet, är förlustfiler med öppen källkod som skapades som alternativ till AAC- och MP3-filer. Det unika med det här formatet är att det inte begränsas av något patent. Spotifys streamingtjänst använder OGG Vorbis-formatet med 320 kbps.

OGG står egentligen inte för någonting. Faktum är att OGG faktiskt inte är ett komprimeringsformat. Snarare är det en unik multimediabehållare som är gjord för att innehålla ett brett utbud av komprimeringsformat. Anledningen till att det vanligtvis kallas OGG Vorbis är att OGG vanligtvis innehåller Vorbis-filer.

Vorbis kom först år 2000. Det blev ett populärt ljudformat eftersom det följde programvara med öppen källkod. Dessutom ger det högre ljudkvalitet jämfört med de flesta komprimeringsformat med förlust.

Andra mindre vanliga typer av ljudformat

DSD

DSD är ett högupplöst ljudformat som används för Super Audio CD-skivor. Du hittar DSD i många olika varianter, bland annat 2,8, 5,6 och 11,2 MHz. Det är en okomprimerad ljudfil med hög återgivningskvalitet som är utmärkt för kvalitetslyssning, men inte det mest praktiska ljudfilformatet för streaming.

Det unika med DSD-filer är att de bara använder en enda bit, till skillnad från okomprimerade filer som använder ett bitdjup och en samplingsfrekvens. De här filerna samplar den enda biten 2,8 miljoner gånger per sekund för att återskapa filen.

DSD-filer är mycket lika högupplösta 24-bit/96kHz-filer. Men även om detta innovativa format har en otrolig ljudkvalitet är det inte särskilt kompatibelt med många operativsystem. Faktum är att du måste använda en D/A-omvandlare från tredje part för att använda en DSD-fil på ett Mac- eller Windows-system.

Om du har lite extra pengar att lägga på en extern D/A-omvandlare och gillar ljudet av att sampla en enda bit 2,8 miljoner gånger per sekund, kan DSD vara värt att överväga.

MQA

MQA är ett annat högupplöst förlustfritt ljudkomprimeringsformat som skapades för effektivare streaming. Tidal använder MQA för högupplöst streaming, och många CD-skivor använder det också.

Så här väljer du ett ljudfilformat

Filformat för ljudmastering

Så vid det här laget har du massor av information om ljudfilformat lagrad i din hjärna.

Vad gör du med den?

Att välja rätt ljudformat för den aktuella applikationen kan göra stor skillnad.

Vilket ljudformat du väljer att använda beror på om du föredrar ljudkvalitet eller lagringsutrymme. Utöver det beror det också på vilka enheter du använder för uppspelning.

Om du är en allmän lyssnare kan du njuta av komprimerade filformat med hög bithastighet, t.ex. 320 kbps AAC eller MP3.

Om du å andra sidan är musikproducent eller inspelningstekniker vill du använda okomprimerade ljudfiler med höga samplingsfrekvenser. En av de mest populära är 24bit/48kHz WAV och AIFF.

För seriös, kritisk lyssning rekommenderar dock många audiofiler FLAC.

Avslutning Ljudformat

När allt kommer omkring finns det inget "bästa ljudformat".

Personliga preferenser är den största faktorn när det gäller att hitta rätt ljudformat för dig.

Det är viktigt att tänka på några saker, bland annat ditt lagringsutrymme, ditt operativsystem och hur du vill uppfatta din musik.

Det är förstås trevligt med lite extra lagringsutrymme, men vi rekommenderar aldrig att du offrar ljudkvaliteten för det, särskilt inte om ditt fokus är att bli den bästa ljudteknikern du kan bli.

Vi hoppas att du kan använda den här guiden som referens när du stöter på en filtyp som du är osäker på, eftersom kunskap om de olika tillgängliga ljudformatstyperna kommer att göra dig till en mer pålitlig producent eller tekniker i det långa loppet.

Ge dina låtar liv med professionell mastering, på några sekunder!