Formaty plików audio: Kompletny przewodnik

Formaty plików audio: Kompletny przewodnik Formaty plików audio: Kompletny przewodnik

Formaty plików audio są atomowym poziomem produkcji muzyki.

Gdy tworzysz dźwięk do wysłania na platformę streamingową lub nagrania na płytę CD, musisz go jakoś przechowywać.

Oczywiście, przy tak wielu typach formatów plików audio, może być trudno wiedzieć, którego z nich należy użyć w konkretnej sytuacji.

Powstaje pytanie,

Jakiego formatu plików audio należy użyć, aby zapewnić najlepszą możliwą jakość dźwięku?

W tym krótkim przewodniku omówimy wszystko, co musisz wiedzieć o typach formatów audio, abyś mógł wybrać odpowiedni do danego zadania.

Zanurzmy się!

Czym są formaty plików audio?

Format pliku audio można traktować jako przestrzeń do przechowywania informacji audio.

Gdy surowe dane audio wychodzą z interfejsu audio przez przetwornik analogowo-cyfrowy, interfejs użyje modulacji kodu impulsowego (PCM) do ich zakodowania.

Aby odtworzyć tę modulację kodu impulsowego za pomocą systemu fizycznego, należy zorganizować informacje w odtwarzalny plik.

Typy formatów plików audio można rozróżnić na podstawie kontenerów, w których się znajdują, oraz metod kompresji danych, których używają do uporządkowania strumieni PCM.

Chociaż te różne formaty reprezentują te same informacje, poziomy jakości i przestrzeń dyskowa są różne.

Niektóre formaty audio mają nawet unikalne cechy, takie jak przechowywanie metadanych, które dostarczają informacji o treści lub pliku.

Głębsze zanurzenie w PCM

PCM

Jak powiedzieliśmy wcześniej, PCM, czyli modulacja impulsowo-kodowa, to metoda, w której konwertujemy sygnały analogowe na sygnały, które można wykorzystać w domenie cyfrowej. Ten proces konwersji koduje przebiegi z głębią bitową i częstotliwością próbkowania. Głębia bitowa to liczba bitów na próbkę, natomiast częstotliwość próbkowania to liczba próbek na sekundę.

Większość formatów cyfrowych ma częstotliwość próbkowania 24 bity/44,1 kHz.

3 główne grupy formatów audio

Najłatwiejszym sposobem myślenia o formatach audio i różnicach między nimi jest podzielenie ich na trzy główne grupy:

  • Nieskompresowany format audio
  • Skompresowany stratnie format audio
  • Bezstratnie skompresowany format audio

Sprawdź poniższą tabelę, która łączy każdy z głównych formatów audio z jego typem kodowania:

Typy kodowania audio

Stratne pliki audio a bezstratne pliki audio

Bezstratny

W szerokim świecie plików audio można znaleźć stratne i bezstratne formaty plików, które różnią się pod względem kompresji danych.

Kompresja danych jest praktycznym narzędziem pozwalającym zmieścić więcej plików na dysku twardym. Można to rozumieć jako spakowanie wielu pojedynczych plików na komputerze w celu uzyskania mniejszego pliku do przechowywania. Ten rodzaj kompresji bardzo różni się od kompresji dźwięku podczas miksowania lub produkcji muzyki.

W przeciwieństwie do tego, co wielu sądzi, istnieją metody kompresji danych, które mogą zmniejszyć rozmiar plików przy jednoczesnym zachowaniu pełnej integralności informacji zawartych w strumieniu audio. Takie formaty audio określamy mianem bezstratnych formatów skompresowanych.

Z drugiej strony mamy stratnie skompresowane formaty, które eliminują dane w strumieniu audio bez większego wpływu na dźwięk. Istnieją jednak informacje, które są odrzucane przy użyciu tego rodzaju metody kompresji.

Skompresowane formaty audio a nieskompresowane formaty audio

Formaty audio bez jakiejkolwiek formy kompresji są znane jako nieskompresowane formaty audio.

Są to kontenery, które przechowują surowe dane audio bez jakiejkolwiek redukcji jakości lub rozmiaru. Chociaż pliki te mogą być znacznie większe niż skompresowane pliki audio, zapewniają one największą szczegółowość i wierność dźwięku.

Tego typu pliki są często wykorzystywane na różnych etapach produkcji muzycznej, takich jak nagrywanie lub miksowanie.

Mimo to, nie wszystkie nieskompresowane pliki audio są takie same. W plikach tych można znaleźć różne poziomy jakości w zależności od sposobu, w jaki sygnał analogowy został przekonwertowany cyfrowo. Różne typy przetworników analogowo-cyfrowych wykorzystują różne poziomy precyzji i dokładności.

Użycie wyższej głębi bitowej i częstotliwości próbkowania podczas procesu konwersji pozwala na przechwycenie większej ilości informacji.

Głębia bitowa to liczba bitów informacji w próbce audio, która bezpośrednio odnosi się do rozdzielczości każdej próbki. Na przykład, płyta CD wykorzystuje 16 bitów na próbkę, podczas gdy dźwięk na płycie DVD wykorzystuje 24 bity na próbkę.

Precyzja, z jaką przetwornik analogowo-cyfrowy może mierzyć amplitudę lub objętość sygnału, jest miejscem, w którym uzyskujemy głębię bitową.

Często lubię myśleć o głębokości bitów jak o małych znacznikach na taśmie mierniczej. Niższa głębia bitowa może być oznaczeniami w calach, które są znacznie bardziej oddalone od siebie, podczas gdy wyższa głębia bitowa może być oznaczeniami w centymetrach. Zasadniczo, większa głębia bitowa uwzględnia większą liczbę mniejszych, indywidualnych pomiarów.

Zrozumienie szybkości transmisji bitów

Bitrate to ilość danych generowanych przez plik w każdej sekundzie.

Kiedy słuchasz cyfrowego dźwięku, zobaczysz pliki, które mają na końcu oznaczenie "kbps", aby poinformować Cię o powiązanej z nim szybkości transmisji bitów.

Każda sekunda nagrania audio zawiera określoną liczbę bitów. Obliczamy te bity jako "dane na sekundę". Na przykład, jeśli widzisz plik audio z oznaczeniem "280 kbps", oznacza to, że w każdej sekundzie strumienia audio znajduje się 280 kilobitów.

Do określenia jakości formatu pliku używamy bitrate, czyli ilości danych kodowanych w każdej sekundzie.

Podczas gdy przy niższych ustawieniach bitrate uzyskuje się mniejsze skompresowane pliki, jakość dźwięku nie jest tak wysoka. Kiedy dyski twarde pojawiły się po raz pierwszy, konieczne było posiadanie dźwięku o niskiej przepływności, ponieważ nie mieliśmy takiej pojemności pamięci masowej, jaką mamy teraz. To samo dotyczyło większości komputerów, które nie miały przepustowości do przesyłania większych plików.

We współczesnym cyfrowym świecie przepustowość i pamięć masowa nie są kwestiami, o które musimy się martwić, dlatego też zawsze zaleca się stosowanie najwyższej możliwej przepływności podczas pracy z formatami stratnymi.

Na przykład, jeśli pracujesz z plikiem MP3, standardem wysokiej jakości jest 320 kbps. Przy tych ustawieniach wysokiej jakości może być dość trudno odróżnić skompresowany dźwięk od nieskompresowanego dźwięku podczas swobodnego słuchania.

Zrozumienie dźwięku wysokiej rozdzielczości

Teraz możesz się zastanawiać,

A co z dźwiękiem o wysokiej rozdzielczości?

Dźwięk o wysokiej rozdzielczości jest dość wyjątkowy, ponieważ nie ma dla niego jednego standardu.

Jednakże, gdy producenci i inżynierowie mówią o dźwięku wysokiej rozdzielczości, często odnoszą się do plików audio o częstotliwościach próbkowania lub głębi bitowej powyżej standardu CD, który wynosi 16 bitów/44,1 kHz.

W naszych oczach pliki wysokiej rozdzielczości to 24-bit/48kHz, 24-bit/96kHz i 24-bit/192kHz.

Piękno plików audio w wysokiej rozdzielczości polega na tym, że zawierają one znacznie więcej informacji niż pliki w niskiej rozdzielczości lub skompresowany dźwięk, co oznacza, że jakość dźwięku jest znacznie lepsza. Chociaż dźwięk w wysokiej rozdzielczości zajmuje więcej miejsca na dysku, może być tego wart, jeśli zależy ci na jakości.

Niektóre z najpopularniejszych nieskompresowanych plików audio o wysokiej rozdzielczości to WAV i AIFF, choć istnieją również formaty audio FLAC i ALAC.

Popularne formaty plików audio

Chociaż istnieje kilka różnych formatów plików audio, nie wszystkie z nich są bardzo popularne.

W trakcie swojej przygody z produkcją muzyczną prawdopodobnie zetkniesz się tylko z kilkoma różnymi typami formatów audio. Oto niektóre z głównych, które powinieneś znać:

MP3

Najpopularniejszym formatem audio do zwykłego słuchania jest MP3.

Kiedy nadeszły wczesne lata 2000, popularność Mp3 wzrosła, a wszystko to dzięki rewolucji dzielenia się plikami, którą zapoczątkował Napster. W październiku 2001 roku Steve Jobs wyciągnął z kieszeni małe urządzenie, na którym znajdowało się 1000 takich plików.

To, co było tak wspaniałe w MP3, to ilość informacji, które mogliśmy przechowywać w tak małych pojemnikach przy zachowaniu jakości dźwięku.

Oczywiście jednym z powodów, dla których pliki MP3 znalazły się w centrum nielegalnego pobierania muzyki, był fakt, że można je było łatwo zakodować z płyt CD.

W dzisiejszym świecie pliki MP3 są nadal jednym z najpopularniejszych formatów plików audio. Nawet największe sklepy z cyfrowymi plikami audio do pobrania, takie jak Bandcamp, nadal używają plików MP3 jako głównego formatu.

Są to jedne z najwygodniejszych plików do przechowywania muzyki na tabletach lub przenośnych urządzeniach odtwarzających. Ponadto, pliki MP3 działają na prawie każdym urządzeniu odtwarzającym.

Szybkość bitowa, z jaką nagrywane są pliki MP3, może mieć znaczny wpływ na jakość ich dźwięku. Na przykład, plik MP3 z kodowaniem 128 kb/s będzie miał niższą jakość dźwięku niż plik MP3 z kodowaniem 320 kb/s.

Poniżej znajduje się porównanie rozmiaru plików MP3 i innych typów plików:

Porównanie rozmiaru pliku

FLAC/ALAC/WMA

Pliki FLAC to bezstratnie skompresowane pliki audio o otwartym kodzie źródłowym. Ten format plików audio był jednym z pierwszych bezstratnych formatów, które zostały wprowadzone do powszechnego użytku. FLAC to skrót od Free Lossless Audio Codec. Pliki te są o około połowę mniejsze od standardowego pliku WAV lub AIFF z taką samą częstotliwością próbkowania.

Pliki FLAC nie powodują jednak utraty jakości dźwięku. Są one lepsze niż jakość CD, ponieważ zapewniają rozdzielczość do 32 bitów/96 kHz.

Piękno plików FLAC polega na tym, że pozwalają one użytkownikom z ograniczoną pamięcią na urządzeniach odsłuchowych cieszyć się bezstratnym dźwiękiem. Podczas gdy przeciętnemu słuchaczowi może być trudno odróżnić FLAC od MP3, wielu audiofilów szybko debatuje nad różnicami.

ALAC jest bardzo podobny do FLAC, choć został opracowany przez Apple. Ten typ pliku oznacza Apple Lossless Audio Codec.

ALAC to świetna alternatywa dla FLAC dla użytkowników Apple Music lub iOS. Należy jednak pamiętać, że pliki ALAC są nieco większe niż pliki FLAC.

Alternatywą dla systemu Windows jest WMA, co oznacza Windows Media Audio. Ta alternatywa została opracowana przez Microsoft dla systemu operacyjnego Windows. WMA może obsługiwać częstotliwości próbkowania do 24 bitów/96 kHz, odtwarzając je bez usuwania danych.

Należy pamiętać, że system Windows opracował również stratny format WMA, który może być wart rozważenia, jeśli masz komputer z systemem Windows i chcesz zmniejszyć rozmiary plików, jednocześnie ciesząc się wyższą wiernością dźwięku niż MP3.

AAC

Pliki AAC to stratnie skompresowane pliki audio, które zostały stworzone przez szereg firm zajmujących się technologiami cyfrowymi, w tym Bell, Microsoft i Dolby. Ideą stojącą za stworzeniem formatu pliku audio AAC jest to, że miał on być bardziej wydajny niż MP3.

Jeśli kiedykolwiek posiadałeś iPoda, to już wcześniej słuchałeś plików audio w formacie AAC, ponieważ sklep iTunes korzysta z plików AAC.

AAC jest nieco bardziej wydajny niż MP3 i wielu twierdzi, że brzmi lepiej. Jest używany na platformie streamingowej Apple Music, a także na platformie streamingowej YouTube.

WAV/AIFF

Pliki WAV (Waveform Audio File Format) są jednym z najpopularniejszych bezstratnych, nieskompresowanych formatów audio. Ludzie często używają również plików AIFF zamiast plików WAV, ponieważ oba te typy plików zawierają taką samą ilość informacji. Zasadniczo działają one bardzo podobnie.

Oba te pliki są oparte na PCM lub modulacji kodu impulsowego, która jest jedną z najprostszych metod mechanizmu przechowywania dźwięku w świecie cyfrowym.

Różnica polega na tym, że pliki WAV zostały opracowane dla użytkowników komputerów PC przez IBM i Microsoft, dlatego można je znaleźć na platformach opartych na systemie Windows. WAV jest również standardowym formatem kodowania płyt CD.

Z drugiej strony, pliki AIFF (Audio Interchange File Format) zostały opracowane dla użytkowników Apple jako alternatywa dla WAV. Nie są one tak powszechnie używane jak pliki WAV, choć mają znacznie lepszą obsługę metadanych. W przeciwieństwie do plików WAV, pliki AIFF mogą zawierać dane takie jak tytuły utworów i okładki.

Pliki AIFF wykorzystują modulację kodu impulsowego, co oznacza, że nie kompresują ani nie tracą informacji po drodze. Jeśli nagrywasz w Logic, możesz zauważyć, że AIFF jest jednym z niewielu dostępnych opcji.

Oczywiście można używać dowolnego formatu na każdej platformie.

Główną wadą obu tych rodzajów plików jest to, że są one bardzo duże. Plik o jakości CD 16 bitów/44,1 kHz zajmuje średnio około 10 MB miejsca na każdą minutę dźwięku.

W związku z tym są to dwa pliki wybierane przez inżynierów dźwięku, którzy chcą, aby dźwięk zachowywał najwyższą jakość.

OGG Vorbis

Pliki OGG Vorbis, często określane jako format Vorbis, są stratnymi plikami open-source, które zostały stworzone jako alternatywa dla plików AAC i MP3. Wyjątkowość tego formatu polega na tym, że nie jest on ograniczony żadnym patentem. Usługa streamingu Spotify wykorzystuje format OGG Vorbis przy 320 kbps.

OGG w rzeczywistości nic nie oznacza. W rzeczywistości OGG nie jest formatem kompresji. Jest to raczej unikalny kontener multimedialny, który jest przeznaczony do przechowywania szerokiej gamy formatów kompresji. Powodem, dla którego OGG jest powszechnie nazywany OGG Vorbis jest to, że OGG zazwyczaj zawiera pliki Vorbis.

Vorbis pojawił się po raz pierwszy w 2000 roku. Stał się popularnym formatem audio, ponieważ był zgodny z oprogramowaniem typu open source. Ponadto, w porównaniu do większości formatów kompresji stratnej, zapewnia wyższą jakość dźwięku.

Inne mniej popularne typy formatów audio

DSD

DSD to format audio o wysokiej rozdzielczości, który jest używany w płytach Super Audio CD. DSD występuje w wielu odmianach, w tym 2,8, 5,6 i 11,2 MHz. Jest to wysokiej jakości, nieskompresowany plik audio, który doskonale nadaje się do wysokiej jakości słuchania, choć nie jest najbardziej praktycznym formatem plików audio do przesyłania strumieniowego.

Unikalną cechą plików DSD jest to, że wykorzystują one tylko jeden bit, w przeciwieństwie do nieskompresowanych plików, które wykorzystują głębię bitową i częstotliwość próbkowania. Pliki te próbkują ten pojedynczy bit 2,8 miliona razy na sekundę w celu odtworzenia pliku.

Pliki DSD są bardzo podobne do plików o wysokiej rozdzielczości 24-bit/96 kHz. Jednakże, choć ten innowacyjny format charakteryzuje się niesamowitą jakością dźwięku, nie jest on zbyt kompatybilny z wieloma systemami operacyjnymi. W rzeczywistości, aby korzystać z pliku DSD w systemie Mac lub Windows, należy użyć konwertera cyfrowo-analogowego innej firmy.

Jeśli masz trochę dodatkowej gotówki do wydania na zewnętrzny przetwornik cyfrowo-analogowy i lubisz dźwięk próbkowania pojedynczego bitu 2,8 miliona razy na sekundę, DSD może być warte rozważenia.

MQA

MQA to kolejny format bezstratnej kompresji dźwięku o wysokiej rozdzielczości, który został stworzony z myślą o bardziej wydajnym strumieniowaniu. Tidal wykorzystuje MQA do strumieniowania w wysokiej rozdzielczości, a wiele płyt CD również z niego korzysta.

Jak wybrać format pliku audio

Formaty plików do masteringu audio

W tym momencie masz mnóstwo informacji o formacie plików audio przechowywanych w mózgu.

Co z nim zrobić?

Wybór odpowiedniego formatu audio dla danej aplikacji może mieć duże znaczenie.

Wybrany format audio będzie zależeć od tego, czy preferujesz jakość dźwięku, czy przestrzeń dyskową. Co więcej, będzie to również zależeć od tego, jakich urządzeń używasz do odtwarzania.

Jeśli jesteś zwykłym słuchaczem, możesz cieszyć się skompresowanymi formatami plików o wysokiej przepływności, takimi jak 320 kb/s AAC lub MP3.

Z drugiej strony, jeśli jesteś producentem muzycznym lub inżynierem nagrań, będziesz chciał używać nieskompresowanych plików audio o wysokiej częstotliwości próbkowania. Jednymi z najpopularniejszych są 24bit/48kHz WAV i AIFF.

Do poważnego, krytycznego słuchania wielu audiofilów poleca jednak FLAC.

Podsumowując formaty audio

Kiedy wszystko jest już powiedziane i zrobione, nie ma "najlepszego formatu audio".

Osobiste preferencje są najważniejszym czynnikiem wpływającym na wybór odpowiedniego formatu audio.

Ważne jest, aby pamiętać o kilku rzeczach, w tym o przestrzeni dyskowej, systemie operacyjnym i sposobie postrzegania muzyki.

Oczywiście, chociaż posiadanie dodatkowej przestrzeni dyskowej jest z pewnością miłe, nigdy nie zalecamy poświęcania jakości dźwięku, zwłaszcza jeśli koncentrujesz się na byciu najlepszym inżynierem dźwięku, jakim możesz być.

Mamy nadzieję, że niniejszy przewodnik posłuży ci jako punkt odniesienia za każdym razem, gdy natkniesz się na typ pliku, którego nie jesteś pewien, ponieważ znajomość różnych dostępnych typów formatów audio sprawi, że na dłuższą metę będziesz bardziej niezawodnym producentem lub inżynierem.

Ożyw swoje utwory dzięki profesjonalnemu masteringowi w kilka sekund!