Formáty zvukových souborů jsou na atomární úrovni hudební produkce.
Když vytváříte zvuk, který chcete odeslat na streamovací platformu nebo vypálit na CD, musíte ho nějak uložit.
Vzhledem k velkému počtu typů zvukových souborů může být samozřejmě obtížné zjistit, který z nich je třeba použít v konkrétní situaci.
Otázka zní,
Jaký formát zvukového souboru musíte použít, abyste zajistili co nejlepší kvalitu zvuku?
V tomto krátkém průvodci probereme vše, co potřebujete vědět o typech zvukových formátů, abyste si mohli vybrat ten správný pro danou úlohu.
Ponořme se do toho!
Co jsou formáty zvukových souborů?
Formát zvukového souboru si můžete představit jako úložný prostor pro zvukové informace.
Když surová zvuková data vycházejí z vašeho zvukového rozhraní přes analogově-digitální převodník, vaše rozhraní je zakóduje pomocí pulzní kódové modulace (PCM).
Chcete-li tuto pulzně kódovou modulaci přehrát pomocí fyzického systému, musíte informace uspořádat do přehrávaného souboru.
Typy formátů zvukových souborů lze rozlišit podle kontejnerů, ve kterých se nacházejí, a podle metod komprese dat, které používají k zachování pořádku v datových tocích PCM.
Ačkoli tyto různé formáty představují stejné informace, liší se úrovní kvality a úložným prostorem.
Některé zvukové formáty mají dokonce jedinečné vlastnosti, například ukládání metadat, která poskytují informace o obsahu nebo souboru.
Hlubší ponor do PCM

Jak jsme již uvedli, PCM neboli pulzně-kódová modulace je metoda, kterou převádíme analogové signály na signály, které lze použít v digitální oblasti. Tento proces převodu kóduje průběhy s bitovou hloubkou a vzorkovací frekvencí. Bitová hloubka je počet bitů na vzorek, zatímco vzorkovací frekvence je počet vzorků za sekundu.
Většina digitálních formátů má vzorkovací frekvenci 24 bitů/44,1 kHz.
3 hlavní skupiny zvukových formátů
Nejjednodušší způsob, jak si představit zvukové formáty a jejich vzájemné rozdíly, je rozdělit je do tří hlavních skupin:
- Nekomprimovaný zvukový formát
- Ztrátový komprimovaný zvukový formát
- Bezztrátový komprimovaný zvukový formát
Podívejte se na následující tabulku, která spojuje jednotlivé hlavní zvukové formáty s jejich typem kódování:

Ztrátové zvukové soubory vs. bezztrátové zvukové soubory

V širokém světě zvukových souborů najdete ztrátové a bezeztrátové formáty souborů, které se liší z hlediska komprese dat.
Kompresi dat používáme jako praktický nástroj, který nám umožňuje umístit na pevný disk více souborů. Můžete si ji představit jako zazipování několika jednotlivých souborů v počítači, abyste získali menší soubor k uložení. Tento typ komprese se velmi liší od komprese zvuku při mixování nebo hudební produkci.
Navzdory tomu, co si mnozí myslí, existují metody komprese dat, které mohou zmenšit soubory a zároveň zachovat plnou integritu informací obsažených ve zvukovém proudu. Tyto zvukové formáty označujeme jako bezeztrátově komprimované formáty.
Na druhou stranu existují ztrátově komprimované formáty, které eliminují data v rámci zvukového proudu, aniž by to mělo zásadní vliv na zvuk. Při použití této metody komprese však dochází k vyhození informací.
Komprimované zvukové formáty vs. nekomprimované zvukové formáty
Zvukové formáty bez jakékoli formy komprese se označují jako nekomprimované zvukové formáty.
Jedná se o kontejnery, které ukládají surová zvuková data bez jakéhokoli snížení kvality nebo velikosti. Tyto soubory mohou být sice mnohem větší než komprimované zvukové soubory, ale poskytují nejvíce detailů a věrnost zvuku.
Tyto typy souborů se často používají v různých krocích hudební produkce, například při nahrávání nebo mixování.
Přesto nejsou všechny nekomprimované zvukové soubory stejné. V těchto souborech najdete různé úrovně kvality podle způsobu, jakým byl analogový signál digitálně převeden. Různé typy analogově-digitálních převodníků používají různé úrovně přesnosti a preciznosti.
Pokud při převodu použijete vyšší bitovou hloubku a vzorkovací frekvenci, můžete zachytit více informací.
Bitová hloubka je počet bitů informace ve zvukovém vzorku, který přímo souvisí s rozlišením každého vzorku. Například CD používá 16 bitů na vzorek, zatímco zvuk na DVD používá 24 bitů na vzorek.
Přesnost, s jakou může analogově-digitální převodník měřit amplitudu nebo objem signálu, je místem, kde získáváme bitovou hloubku.
Často rád přemýšlím o hloubce bitů jako o malých značkách na měřícím pásku. Menší bitová hloubka může být palcová značka, která je od sebe mnohem dále, zatímco větší bitová hloubka může být centimetrová značka. Vyšší bitová hloubka v podstatě zohledňuje větší počet menších jednotlivých měření.
Pochopení přenosové rychlosti
Datový tok je množství dat, které soubor vytvoří každou sekundu.
Při poslechu digitálního zvuku se setkáte se soubory, které mají na konci označení "kb/s", které vám sdělí, jaký datový tok je s nimi spojen.
Každá sekunda zvukového záznamu obsahuje určité množství bitů. Tyto bity počítáme pomocí "dat za sekundu". Pokud například vidíte zvukový soubor, u kterého je uvedeno "280 kb/s", znamená to, že v každé sekundě zvukového proudu je 280 kilobitů.
Pro určení kvality formátu souboru používáme datový tok, což je množství dat zakódovaných každou sekundu.
Při nastavení nižšího datového toku sice získáte menší komprimované soubory, ale kvalita zvuku není tak vysoká. Když vznikly pevné disky, bylo nutné mít zvuk s nízkou bitovou rychlostí, protože jsme neměli takovou úložnou kapacitu jako nyní. Stejně tomu bylo i u většiny počítačů, které neměly takovou šířku pásma, aby mohly přenášet větší soubory.
V moderním digitálním světě si s šířkou pásma a úložištěm nemusíme dělat starosti, a proto se při práci se ztrátovými formáty vždy doporučuje používat co nejvyšší přenosovou rychlost.
Pokud například pracujete s formátem MP3, je standardem pro vysokou kvalitu 320 kb/s. Při těchto nastaveních vysoké kvality může být při běžném poslechu poměrně obtížné rozlišit komprimovaný zvuk od nekomprimovaného.
Porozumění zvuku s vysokým rozlišením
Možná si teď říkáte,
A co zvuk s vysokým rozlišením?
Zvuk s vysokým rozlišením je zcela jedinečný, protože pro něj neexistuje jednotný standard.
Když však producenti a inženýři mluví o zvuku s vysokým rozlišením, často mají na mysli zvukové soubory se vzorkovací frekvencí nebo bitovou hloubkou vyšší než je standard CD, tedy 16 bitů/44,1 kHz.
Soubory s vysokým rozlišením jsou podle nás 24 bitů/48 kHz, 24 bitů/96 kHz a 24 bitů/192 kHz.
Krása zvukových souborů s vysokým rozlišením spočívá v tom, že obsahují mnohem více informací než soubory s nízkým rozlišením nebo komprimovaný zvuk, což znamená, že kvalita zvuku je mnohem lepší. Zvuk ve vysokém rozlišení sice zabírá více úložného prostoru, ale pokud vám jde o kvalitu, může to stát za to.
Mezi nejoblíbenější nekomprimované zvukové soubory s vysokým rozlišením patří WAV a AIFF, existují však také zvukové formáty FLAC a ALAC.
Běžné formáty zvukových souborů
Přestože existuje několik různých formátů zvukových souborů, ne všechny jsou velmi rozšířené.
Při své obecné hudební produkci se pravděpodobně setkáte jen s několika různými typy zvukových formátů. Zde jsou některé z hlavních, které byste měli znát:
MP3
Nejběžnějším zvukovým formátem pro běžný poslech je MP3.
Na začátku roku 2000 se Mp3 staly populárními díky revoluci ve sdílení souborů, kterou odstartoval Napster. V říjnu 2001 vytáhl Steve Jobs z kapsy malé zařízení s tisícovkou těchto souborů.
Na MP3 bylo skvělé to, kolik informací jsme byli schopni uložit do tak malých obalů při zachování kvality zvuku.
Jedním z důvodů, proč se MP3 dostaly do centra nelegálního stahování hudby, byla samozřejmě skutečnost, že je bylo možné snadno zakódovat z CD.
V dnešním světě jsou soubory MP3 stále jedním z nejběžnějších typů zvukových souborů. Dokonce i velké obchody s digitálními zvukovými soubory ke stažení, jako je Bandcamp, stále používají jako hlavní formát soubory MP3.
Jsou to jedny z nejvhodnějších souborů pro ukládání hudby do tabletů nebo přenosných přehrávacích zařízení. Navíc soubory MP3 fungují téměř na každém přehrávacím zařízení.
Bitová rychlost, kterou jsou soubory MP3 nahrány, může výrazně ovlivnit kvalitu jejich zvuku. Například MP3 s kódováním 128 kb/s bude mít horší kvalitu zvuku než MP3 s kódováním 320 kb/s.
Podívejte se níže, abyste získali představu o velikosti souborů MP3 a jiných typů souborů:

FLAC/ALAC/WMA
Soubory FLAC jsou bezeztrátově komprimované zvukové soubory s otevřeným zdrojovým kódem. Tento formát zvukových souborů byl jedním z prvních bezztrátových formátů, které se začaly používat. FLAC je zkratka pro Free Lossless Audio Codec. Tyto soubory mají přibližně poloviční velikost než standardní soubory WAV nebo AIFF se stejnou vzorkovací frekvencí.
U souborů FLAC však nedochází ke ztrátě kvality zvuku. Jsou lepší než kvalita CD, protože poskytují rozlišení až 32 bitů/96 kHz.
Krása souborů FLAC spočívá v tom, že umožňují uživatelům s omezeným úložištěm v poslechových zařízeních poslouchat bezztrátový zvuk. Zatímco pro běžného posluchače může být těžké rozeznat rozdíl mezi soubory FLAC a MP3, mnoho audiofilů o rozdílech rychle diskutuje.
ALAC je velmi podobný formátu FLAC, i když ho vyvinula společnost Apple. Tento typ souboru znamená Apple Lossless Audio Codec.
ALAC je skvělou alternativou k FLAC pro uživatele Apple Music nebo iOS. Mějte však na paměti, že soubory ALAC jsou o něco větší než soubory FLAC.

Alternativou systému Windows je WMA, což je zkratka pro Windows Media Audio. Tuto alternativu vyvinula společnost Microsoft pro operační systém Windows. WMA zvládá vzorkovací frekvence až 24 bitů/96 kHz a reprodukuje je bez odstranění dat.
Všimněte si, že systém Windows vyvinul také ztrátový formát WMA, který by mohl stát za zvážení, pokud máte počítač se systémem Windows a chcete snížit velikost souborů a zároveň využívat vyšší věrnost zvuku než u formátu MP3.
AAC
Soubory AAC jsou ztrátově komprimované zvukové soubory, které vytvořila řada společností zabývajících se digitálními technologiemi, včetně společností Bell, Microsoft a Dolby. Myšlenka vytvoření formátu zvukových souborů AAC spočívá v tom, že měl být efektivnější než formát MP3.
Pokud jste někdy vlastnili iPod, pak jste již poslouchali zvukové soubory ve formátu AAC, protože obchod iTunes používá soubory AAC.
AAC je o něco efektivnější než MP3 a podle mnohých zní lépe. Používá se ve streamovací platformě Apple Music a také ve streamovací platformě YouTube.
WAV/AIFF
Soubory WAV (Waveform Audio File Format) jsou jedním z nejrozšířenějších bezeztrátových nekomprimovaných zvukových formátů. Místo souborů WAV se často používají také soubory AIFF, protože oba tyto typy souborů obsahují stejné množství informací. V podstatě fungují velmi podobně.
Oba tyto soubory jsou založeny na PCM neboli pulzní kódové modulaci, což je jedna z nejjednodušších metod ukládání zvuku v digitálním světě.
Rozdíl je v tom, že soubory WAV byly vyvinuty pro uživatele PC společnostmi IBM a Microsoft, a proto je najdete na platformách se systémem Windows. WAV je také standardní formát kódování pro CD.
Na druhou stranu soubory AIFF (Audio Interchange File Format) byly vyvinuty pro uživatele společnosti Apple jako alternativa formátu WAV. Nejsou tak rozšířené jako soubory WAV, i když mají mnohem lepší podporu metadat. Na rozdíl od souborů WAV můžete do souborů AIFF zahrnout údaje, jako jsou názvy skladeb a obaly.
Soubory AIFF využívají pulzní kódovou modulaci, což znamená, že se nekomprimují a neztrácejí informace. Pokud nahráváte v programu Logic, můžete si všimnout, že AIFF je jednou z mála možností, které máte.
Na každé platformě můžete samozřejmě používat oba formáty.
Hlavní nevýhodou obou těchto typů souborů je jejich velká velikost. Soubor v 16bitové/44,1 kHz kvalitě CD zabírá v průměru asi 10 MB místa na každou minutu zvuku.
Jedná se tedy o dva soubory, které si vybírají zvukoví inženýři, kteří chtějí zvuk v nejvyšší kvalitě.
OGG Vorbis
Soubory OGG Vorbis, často označované jako formát Vorbis, jsou ztrátové open-source soubory, které byly vytvořeny jako alternativa k souborům AAC a MP3. Jedinečnost tohoto formátu spočívá v tom, že není omezen žádným patentem. Streamovací služba Spotify používá formát OGG Vorbis s datovým tokem 320 kb/s.
OGG ve skutečnosti nic neznamená. OGG vlastně není kompresní formát. Je to spíše jedinečný multimediální kontejner, který je vytvořen tak, aby pojal širokou škálu kompresních formátů. Důvodem, proč se mu běžně říká OGG Vorbis, je to, že OGG obvykle obsahuje soubory Vorbis.
Vorbis se poprvé objevil v roce 2000. Stal se populárním zvukovým formátem, protože se držel softwaru s otevřeným zdrojovým kódem. Navíc ve srovnání s většinou ztrátových kompresních formátů poskytuje vyšší kvalitu zvuku.
Další méně obvyklé typy zvukových formátů
DSD
DSD je zvukový formát s vysokým rozlišením, který se používá pro disky Super Audio CD. DSD najdete v mnoha variantách, včetně 2,8, 5,6 a 11,2 MHz. Jedná se o nekomprimovaný zvukový soubor s vysokou věrností, který je skvělý pro kvalitní poslech, i když není nejpraktičtějším formátem zvukového souboru pro streamování.
Jedinečnost souborů DSD spočívá v tom, že používají pouze jeden bit, na rozdíl od nekomprimovaných souborů, které používají bitovou hloubku a vzorkovací frekvenci. Tyto soubory vzorkují tento jediný bit 2,8 milionkrát za sekundu, aby soubor znovu vytvořily.
Soubory DSD jsou velmi podobné souborům s vysokým rozlišením 24 bitů/96 kHz. Tento inovativní formát má sice neuvěřitelnou kvalitu zvuku, ale není příliš kompatibilní s mnoha operačními systémy. Ve skutečnosti musíte použít D/A převodník třetí strany, abyste mohli používat soubor DSD v systému Mac nebo Windows.
Pokud máte trochu peněz navíc na externí D/A převodník a líbí se vám zvuk vzorkování jednoho bitu 2,8 milionukrát za sekundu, DSD by mohlo stát za zvážení.
MQA
MQA je další formát bezeztrátové komprese zvuku s vysokým rozlišením, který byl vytvořen pro efektivnější streamování. Tidal používá MQA pro streamování ve vysokém rozlišení a používá ho i mnoho CD.
Jak vybrat formát zvukového souboru

V tuto chvíli máte v mozku uloženy spousty informací o formátu zvukových souborů.
Co s ním uděláte?
Výběr správného formátu zvuku pro danou aplikaci může mít velký význam.
Zvolený zvukový formát závisí na tom, zda dáváte přednost kvalitě zvuku nebo úložnému prostoru. Kromě toho bude také záležet na tom, jaká zařízení používáte k přehrávání.
Pokud jste běžný posluchač, můžete si vychutnat komprimované formáty souborů s vysokou přenosovou rychlostí, například AAC nebo MP3 s rychlostí 320 kb/s.
Na druhou stranu, pokud jste hudební producent nebo nahrávací inženýr, budete chtít používat nekomprimované zvukové soubory s vysokou vzorkovací frekvencí. Mezi nejoblíbenější patří 24bit/48kHz WAV a AIFF.
Pro seriózní a kritický poslech však mnoho audiofilů doporučuje FLAC.
Ukončení zvukových formátů
Když se to vezme kolem a kolem, neexistuje žádný "nejlepší zvukový formát".
Největší roli při výběru vhodného zvukového formátu hrají osobní preference.
Je důležité mít na paměti několik věcí, včetně úložného prostoru, operačního systému a způsobu, jakým chcete hudbu vnímat.
Samozřejmě, i když je trochu úložného prostoru navíc jistě příjemné, nikdy nedoporučujeme obětovat kvůli tomu kvalitu zvuku, zejména pokud je vaším cílem být co nejlepším zvukovým inženýrem.
Doufáme, že vám tento průvodce poslouží jako referenční příručka, kdykoli narazíte na typ souboru, kterým si nejste jisti, protože znalost různých dostupných typů zvukových formátů z vás v dlouhodobém horizontu udělá spolehlivějšího producenta nebo inženýra.