Формати аудіофайлів: Повний посібник

Формати аудіофайлів: Повний посібник Формати аудіофайлів: Повний посібник

Формати аудіофайлів знаходяться на атомарному рівні музичного виробництва.

Коли ви створюєте аудіо, щоб відправити його на стрімінгову платформу або записати на компакт-диск, вам потрібно якось його зберігати.

Звичайно, з такою великою кількістю типів форматів аудіофайлів може бути важко зрозуміти, який з них потрібно використовувати у вашій конкретній ситуації.

Виникає питання,

Який формат аудіофайлів потрібно використовувати, щоб забезпечити найкращу якість звуку?

У цьому короткому посібнику ми обговоримо все, що вам потрібно знати про типи аудіоформатів, щоб ви могли вибрати правильний для вашої роботи.

Давайте зануримося!

Які існують формати аудіофайлів?

Формат аудіофайлу можна розглядати як місце для зберігання аудіоінформації.

Коли необроблені аудіодані виходять з вашого аудіоінтерфейсу через аналого-цифровий перетворювач, ваш інтерфейс використовує імпульсно-кодову модуляцію (ІКМ) для їхнього кодування.

Щоб відтворити цю імпульсно-кодову модуляцію за допомогою фізичної системи, ви повинні організувати інформацію у файл, який можна відтворити.

Типи форматів аудіофайлів можна розрізняти за контейнерами, в яких вони знаходяться, і методами стиснення даних, які вони використовують для упорядкування потоків PCM.

Хоча ці різні формати представляють одну й ту ж інформацію, рівень якості та місце для зберігання відрізняються.

Деякі аудіоформати навіть мають унікальні характеристики, такі як зберігання метаданих, які містять інформацію про вміст або файл.

Глибше занурення в PCM

PCM

Як ми вже говорили раніше, PCM, або імпульсно-кодова модуляція, - це метод, за допомогою якого ми перетворюємо аналогові сигнали в сигнали, які можуть бути використані в цифровому середовищі. Цей процес перетворення кодує форми сигналу з певною розрядністю і частотою дискретизації. Бітова глибина - це кількість бітів у відліку, а частота дискретизації - це кількість відліків за секунду.

Більшість цифрових форматів мають частоту дискретизації 24 біт/44,1 кГц.

3 основні групи аудіоформатів

Найпростіший спосіб зрозуміти аудіоформати і те, чим вони відрізняються один від одного, - розділити їх на три основні групи:

  • Формат аудіо без стиснення
  • Формат стисненого аудіо з втратами
  • Формат стисненого аудіо без втрат

Ознайомтеся з таблицею нижче, яка пов'язує кожен з основних аудіоформатів з типом кодування:

Типи кодування аудіо

Аудіофайли з втратами проти аудіофайлів без втрат

Без втрат

У широкому світі аудіофайлів ви знайдете формати файлів з втратами і без втрат, які відрізняються за ступенем стиснення даних.

Ми використовуємо стиснення даних як практичний інструмент для розміщення більшої кількості файлів на жорсткому диску. Ви можете уявити це як заархівування декількох окремих файлів на вашому комп'ютері, щоб отримати файл меншого розміру для зберігання. Цей тип стиснення дуже відрізняється від стисненого аудіо при зведенні або виробництві музики.

Всупереч тому, що багато хто вважає, існують методи стиснення даних, які дозволяють зменшити розмір файлів, зберігаючи при цьому повну цілісність інформації, що міститься в аудіопотоці. Ми називаємо такі аудіоформати стиснутими без втрат.

З іншого боку, існують формати стиснення з втратами, які видаляють дані з аудіопотоку без значного впливу на звук. Однак є інформація, яка втрачається при використанні цього методу стиснення.

Стиснуті аудіоформати проти нестиснених аудіоформатів

Аудіоформати без будь-якого стиснення відомі як нестиснуті аудіоформати.

Це контейнери, в яких зберігаються необроблені аудіодані без будь-якого зниження якості або розміру. Хоча ці файли можуть бути набагато більшими, ніж стиснуті аудіофайли, вони забезпечують найбільшу деталізацію і точність звуку.

Ці типи файлів часто використовуються на різних етапах музичного виробництва, таких як запис або зведення.

Незважаючи на це, не всі нестиснуті аудіофайли однакові. Ви знайдете різні рівні якості в цих файлах залежно від того, як аналоговий сигнал було перетворено в цифровий формат. Різні типи аналого-цифрових перетворювачів використовують різні рівні точності та достовірності.

Якщо ви використовуєте більшу глибину розрядності та частоту дискретизації під час процесу перетворення, ви можете захопити більше інформації.

Бітова глибина - це кількість бітів інформації в аудіозаписі, яка безпосередньо пов'язана з роздільною здатністю кожного зразка. Наприклад, на компакт-диску використовується 16 біт на семпл, тоді як аудіо на DVD - 24 біти на семпл.

Точність, з якою аналого-цифровий перетворювач може вимірювати амплітуду або гучність сигналу, визначає глибину розрядності.

Мені часто подобається думати про глибину розбиття, як про маленькі позначки на вимірювальній стрічці. Менша розрядність - це дюймові позначки, які знаходяться набагато далі одна від одної, а більша розрядність - це сантиметрові позначки. По суті, більша розрядність враховує більшу кількість менших, окремих вимірів.

Розуміння швидкості передачі даних

Бітрейт - це кількість даних, що передаються файлом щосекунди.

Коли ви слухаєте цифрове аудіо, ви бачите файли з позначкою "kbps" в кінці, яка вказує на бітрейт, що асоціюється з ним.

Кожна секунда аудіозапису містить певну кількість бітів. Ми обчислюємо ці біти за допомогою "даних в секунду". Наприклад, якщо ви бачите аудіофайл, на якому вказано "280 кбіт/с", це означає, що в кожній секунді аудіо в цьому потоці міститься 280 кілобіт.

Для визначення якості формату файлу ми використовуємо бітрейт, тобто кількість даних, що кодуються щосекунди.

Хоча ви отримуєте менші за розміром стиснуті файли з меншим бітрейтом, якість звуку не така висока. Коли тільки з'явилися жорсткі диски, було необхідно мати аудіо з низьким бітрейтом, оскільки ми не мали такої ємності для зберігання даних, яку маємо зараз. Те ж саме стосувалося і більшості комп'ютерів, які не мали пропускної здатності для передачі великих файлів.

У сучасному цифровому світі пропускна здатність і зберігання даних - це не ті проблеми, про які варто турбуватися, тому при роботі з форматами з втратами завжди рекомендується використовувати максимально можливий бітрейт.

Наприклад, якщо ви працюєте з MP3, стандартом високої якості є 320 кбіт/с. З такими високими налаштуваннями може бути досить важко відрізнити стиснене аудіо від нестисненого під час звичайного прослуховування.

Розуміння аудіо високої роздільної здатності

Можливо, вам цікаво,

А як щодо аудіо високої роздільної здатності?

Аудіо високої роздільної здатності досить унікальне тим, що для нього не існує єдиного стандарту.

Однак, коли продюсери та інженери говорять про аудіо високої роздільної здатності, вони часто мають на увазі аудіофайли з частотою дискретизації або розрядністю вище стандарту CD, який становить 16 біт/44,1 кГц.

Для нас файли з високою роздільною здатністю - це 24 біт/48 кГц, 24 біт/96 кГц і 24 біт/192 кГц.

Перевага аудіофайлів високої роздільної здатності полягає в тому, що вони містять набагато більше інформації, ніж файли з низькою роздільною здатністю або стиснене аудіо, а це означає, що якість звуку набагато краща. Хоча аудіо високої роздільної здатності займає більше місця в пам'яті, це може бути виправдано, якщо вам важлива якість.

Деякі з найпопулярніших нестиснутих аудіофайлів високої роздільної здатності включають WAV і AIFF, хоча існують також аудіоформати FLAC і ALAC.

Поширені формати аудіофайлів

Хоча існує кілька різних форматів аудіофайлів, не всі вони є дуже поширеними.

Під час вашої загальної музичної подорожі ви, швидше за все, зіткнетеся лише з кількома різними типами аудіоформатів. Ось деякі з основних, які вам варто знати:

MP3

Найпоширеніший аудіоформат для повсякденного прослуховування - MP3.

На початку 2000-х років Mp3-файли стали дуже популярними, і все завдяки революції у файлообмінниках, яку розпочав Napster. У жовтні 2001 року Стів Джобс витягнув з кишені невеликий пристрій з 1000 таких файлів.

Що було чудовим у MP3, так це те, як багато інформації ми могли зберігати в таких маленьких контейнерах, зберігаючи при цьому якість звуку.

Звичайно, однією з причин, чому MP3 опинилися в центрі нелегального скачування музики, було те, що їх легко кодувати з компакт-дисків.

У сучасному світі MP3 все ще залишається одним з найпоширеніших форматів аудіофайлів. Навіть найбільші магазини цифрових аудіофайлів, такі як Bandcamp, все ще використовують MP3 як основний формат.

Це одні з найзручніших файлів для зберігання музики на планшетах або портативних пристроях. Крім того, MP3-файли працюють практично на всіх пристроях для відтворення.

Бітрейт, з яким записуються MP3-файли, може суттєво впливати на якість їхнього звучання. Наприклад, MP3 з кодуванням 128 кбіт/с матиме нижчу якість звуку, ніж MP3 з кодуванням 320 кбіт/с.

Подивіться нижче, щоб отримати уявлення про розмір MP3-файлів у порівнянні з іншими типами файлів:

Порівняння розмірів файлів

FLAC/ALAC/WMA

Файли FLAC - це стиснуті аудіофайли з відкритим вихідним кодом без втрат. Цей формат аудіофайлів був одним з найперших форматів без втрат, який отримав широке розповсюдження. FLAC розшифровується як Free Lossless Audio Codec. Ці файли приблизно вдвічі менші за розмір стандартних файлів WAV або AIFF з однаковою частотою дискретизації.

Однак, ви не втрачаєте в якості звуку з FLAC-файлами. Вони мають кращу якість, ніж CD, оскільки забезпечують роздільну здатність до 32 біт/96 кГц.

Принадність файлів FLAC полягає в тому, що вони дозволяють користувачам з обмеженим обсягом пам'яті на пристроях для прослуховування насолоджуватися аудіо без втрат. Хоча пересічному слухачеві може бути важко відрізнити FLAC від MP3, багато аудіофілів охоче обговорюють ці відмінності.

ALAC дуже схожий на FLAC, хоча його було розроблено компанією Apple. Цей тип файлів розшифровується як Apple Lossless Audio Codec.

ALAC є чудовою альтернативою FLAC для користувачів Apple Music або iOS. Зверніть увагу, що ALAC-файли трохи більші за FLAC-файли.

Альтернативою для Windows є WMA, що розшифровується як Windows Media Audio. Ця альтернатива була розроблена компанією Microsoft для операційної системи Windows. WMA може працювати з частотою дискретизації до 24 біт/96 кГц, відтворюючи їх без видалення даних.

Зверніть увагу, що Windows також розробила формат WMA з втратами, який варто розглянути, якщо у вас є комп'ютер під управлінням Windows і ви хочете зменшити розмір файлів, насолоджуючись при цьому вищою якістю звуку, ніж у MP3.

AAC

Файли AAC - це стислі аудіофайли з втратами, які були створені низкою цифрових компаній, зокрема Bell, Microsoft і Dolby. Ідея створення формату AAC полягала в тому, що він мав бути більш ефективним, ніж MP3.

Якщо у вас коли-небудь був iPod, то ви вже слухали аудіофайли у форматі AAC, оскільки магазин iTunes використовує файли AAC.

AAC трохи ефективніший за MP3, і багато хто каже, що він звучить краще. Він використовується для стрімінгової платформи Apple Music, а також для стрімінгової платформи YouTube.

WAV/AIFF

WAV (Waveform Audio File Format) - один з найпоширеніших форматів аудіофайлів без втрат і без стиснення. Люди часто використовують файли AIFF замість WAV, оскільки обидва ці типи файлів містять однакову кількість інформації. По суті, вони працюють дуже схоже.

Обидва ці файли засновані на PCM або імпульсно-кодовій модуляції, яка є одним з найпростіших методів зберігання звуку в цифровому світі.

Різниця полягає в тому, що файли WAV були розроблені для користувачів ПК компаніями IBM і Microsoft, тому ви знайдете їх на платформах на базі Windows. WAV також є стандартним форматом кодування для компакт-дисків.

З іншого боку, файли AIFF (Audio Interchange File Format) були розроблені для користувачів Apple як альтернатива WAV. Вони не так широко використовуються, як файли WAV, хоча мають набагато кращу підтримку метаданих. На відміну від WAV-файлів, до AIFF-файлів можна додавати такі дані, як назви пісень та обкладинки.

Файли AIFF використовують імпульсно-кодову модуляцію, що означає, що вони не стискаються і не втрачають інформацію по дорозі. Якщо ви записуєте в Logic, ви можете помітити, що AIFF - один з небагатьох доступних варіантів.

Звичайно, ви можете використовувати будь-який формат на кожній платформі.

Основним недоліком обох цих типів файлів є те, що вони дуже великі. Файл CD-якості 16 біт/44,1 кГц займає в середньому близько 10 МБ місця на кожну хвилину аудіо.

З огляду на це, ці два файли є найкращим вибором для звукорежисерів, які хочуть отримати звук найвищої якості.

OGG Vorbis

Файли OGG Vorbis, які часто називають форматом Vorbis, - це файли з відкритим вихідним кодом, які були створені як альтернатива файлам AAC і MP3. Унікальність цього формату полягає в тому, що він не обмежений жодним патентом. Стрімінговий сервіс Spotify використовує формат OGG Vorbis з бітрейтом 320 кбіт/с.

OGG насправді нічого не означає. Насправді, OGG не є форматом стиснення. Це скоріше унікальний мультимедійний контейнер, створений для зберігання широкого спектру форматів стиснення. Причина, чому його часто називають OGG Vorbis, полягає в тому, що OGG зазвичай містить файли Vorbis.

Ворбіс вперше з'явився у 2000 році. Він став популярним аудіоформатом, тому що використовує програмне забезпечення з відкритим вихідним кодом. Крім того, порівняно з більшістю форматів стиснення з втратами, він забезпечує вищу якість звуку.

Інші менш поширені типи аудіоформатів

DSD

DSD - це аудіоформат високої роздільної здатності, який використовується для Super Audio CD. Ви знайдете DSD у численних різновидах, включаючи 2,8, 5,6 та 11,2 МГц. Це високоякісний, нестиснений аудіофайл, який чудово підходить для якісного прослуховування, хоча і не є найпрактичнішим форматом для потокового передавання.

Унікальність DSD-файлів полягає в тому, що вони використовують лише один біт, на відміну від нестиснутих файлів, які використовують розрядність і частоту дискретизації. Ці файли беруть цей єдиний біт 2,8 мільйона разів на секунду для відтворення файлу.

Файли DSD дуже схожі на файли з високою роздільною здатністю 24 біт/96 кГц. Однак, хоча цей інноваційний формат має неймовірну якість звуку, він не дуже сумісний з багатьма операційними системами. Фактично, для відтворення DSD-файлів на комп'ютерах Mac або Windows потрібно використовувати сторонні ЦАПи.

Якщо у вас є трохи зайвих грошей, які можна витратити на зовнішній ЦАП, і вам подобається звук дискретизації одного біта 2,8 мільйона разів на секунду, варто звернути увагу на DSD.

MQA

MQA - це ще один формат стиснення аудіо без втрат високої роздільної здатності, який було створено для більш ефективного потокового передавання. Tidal використовує MQA для потокового передавання з високою роздільною здатністю, і багато компакт-дисків також використовують його.

Як вибрати формат аудіофайлу

Формати файлів мастерингу аудіо

Отже, на цей момент у вашому мозку зберігається безліч інформації про формат аудіофайлів.

Що ви з ним робите?

Вибір правильного формату аудіо для конкретної програми може мати велике значення.

Формат аудіо, який ви оберете, залежатиме від того, що вам важливіше - якість звуку чи обсяг пам'яті. Крім того, це також залежить від того, які пристрої ви використовуєте для відтворення.

Якщо ви звичайний слухач, ви можете насолоджуватися стиснутими форматами файлів з високим бітрейтом, такими як 320 кбіт/с AAC або MP3.

З іншого боку, якщо ви музичний продюсер або інженер звукозапису, ви захочете використовувати нестиснуті аудіофайли з високою частотою дискретизації. Одні з найпопулярніших - це WAV і AIFF з частотою дискретизації 24 біт/48 кГц.

Однак для серйозного, критичного прослуховування багато аудіофілів рекомендують FLAC.

Підсумовуючи аудіоформати

Коли все сказано і зроблено, не існує "найкращого аудіоформату".

Особисті вподобання - найбільший фактор, який впливає на вибір правильного формату аудіо для вас.

Важливо мати на увазі кілька речей, зокрема обсяг пам'яті, операційну систему і те, як ви хочете сприймати музику.

Звичайно, мати трохи більше місця для зберігання - це добре, але ми ніколи не рекомендуємо жертвувати якістю звуку заради цього, особливо якщо ви прагнете стати найкращим звукорежисером, яким тільки можете бути.

Ми сподіваємося, що ви зможете використовувати цей посібник як довідник, коли зіткнетеся з типом файлу, в якому не впевнені, оскільки знання різних типів аудіоформатів зробить вас більш надійним продюсером або інженером в довгостроковій перспективі.

Оживіть свої пісні за допомогою мастерингу професійної якості за лічені секунди!