Formatos de ficheiros áudio: O guia definitivo

Formatos de ficheiros áudio: O guia definitivo Formatos de ficheiros áudio: O guia definitivo

Os formatos de ficheiros áudio estão ao nível atómico da produção musical.

Quando cria áudio para enviar para uma plataforma de streaming ou gravar num CD, tem de o armazenar de alguma forma.

Claro que, com tantos tipos de formatos de ficheiros áudio, pode ser difícil saber qual deles deve ser utilizado para a sua situação específica.

A questão que se coloca é a seguinte,

Que formato de ficheiro áudio deve utilizar para garantir que a sua qualidade de som é a melhor possível?

Neste pequeno guia, vamos discutir tudo o que precisa de saber sobre os tipos de formato de áudio para que possa escolher o correto para o trabalho em questão.

Vamos mergulhar!

O que são formatos de ficheiros áudio?

Pode pensar-se num formato de ficheiro áudio como um espaço de armazenamento para informação áudio.

Quando os dados de áudio em bruto saem da sua interface de áudio através do conversor analógico-digital, a sua interface utiliza a modulação de código de impulsos (PCM) para os codificar.

Para reproduzir essa modulação de código de impulsos utilizando um sistema físico, é necessário organizar a informação num ficheiro reproduzível.

Pode diferenciar os tipos de formatos de ficheiros áudio pelos contentores em que se encontram e pelos métodos de compressão de dados que utilizam para manter os fluxos PCM em ordem.

Agora, embora estes vários formatos representem a mesma informação, os níveis de qualidade e o espaço de armazenamento são diferentes.

Alguns formatos de áudio têm mesmo características únicas, como o armazenamento de metadados, que fornece informações sobre o conteúdo ou o ficheiro.

Um mergulho mais profundo no PCM

PCM

Como dissemos anteriormente, PCM, ou modulação por código de impulsos, é o método através do qual convertemos sinais analógicos em sinais que podem ser utilizados no domínio digital. Este processo de conversão codifica as formas de onda com profundidade de bits e taxa de amostragem. A profundidade de bits é o número de bits por amostra, enquanto a taxa de amostragem é o número de amostras por segundo.

A maioria dos formatos digitais tem uma taxa de amostragem de 24 bits/44,1 kHz.

Os 3 principais grupos de formatos de áudio

A forma mais fácil de pensar nos formatos de áudio e na forma como diferem uns dos outros é dividi-los em três grupos principais:

  • Formato de áudio não comprimido
  • Formato de áudio comprimido com perdas
  • Formato de áudio comprimido sem perdas

Consulte a tabela abaixo, que relaciona cada um dos principais formatos de áudio com o seu tipo de codificação:

Tipos de codificação de áudio

Ficheiros de áudio com perdas vs. ficheiros de áudio sem perdas

Sem perdas

No vasto mundo dos ficheiros de áudio, encontrará formatos de ficheiros com e sem perdas, que diferem em termos de compressão de dados.

Utilizamos a compressão de dados como uma ferramenta prática para colocar mais ficheiros num disco rígido. Pode pensar nisto como compactar vários ficheiros individuais no seu computador para obter um ficheiro mais pequeno para armazenar. Este tipo de compressão é muito diferente da compressão de áudio na mistura ou produção musical.

Ao contrário do que muitos pensam, existem métodos de compressão de dados que podem tornar os ficheiros mais pequenos, preservando a integridade total da informação encontrada no fluxo de áudio. Referimo-nos a estes formatos áudio como formatos comprimidos sem perdas.

Por outro lado, existem formatos de compressão com perdas, que eliminam dados no fluxo de áudio sem afetar significativamente o som. No entanto, há informações que são eliminadas com este tipo de método de compressão.

Formatos de áudio comprimido vs. formatos de áudio não comprimido

Os formatos de áudio sem qualquer forma de compressão são conhecidos como formatos de áudio não comprimidos.

Estes são contentores que armazenam dados de áudio em bruto sem qualquer tipo de redução de qualidade ou tamanho. Apesar de estes ficheiros poderem ser muito maiores do que os ficheiros de áudio comprimido, fornecem o máximo de detalhe e fidelidade de áudio.

É frequente encontrar este tipo de ficheiros utilizados em várias etapas da produção musical, como a gravação ou a mistura.

Mesmo assim, nem todos os ficheiros de áudio não comprimidos são iguais. Encontrará diferentes níveis de qualidade nestes ficheiros com base na forma como o sinal analógico foi convertido digitalmente. Diferentes tipos de conversores analógico-digitais utilizam diferentes níveis de precisão e exatidão.

Quando se utiliza uma profundidade de bits e uma taxa de amostragem mais elevadas durante o processo de conversão, é possível captar mais informações.

A profundidade de bits é o número de bits de informação numa amostra de áudio, que se refere diretamente à resolução de cada amostra. Por exemplo, um CD utiliza 16 bits por amostra, enquanto o áudio de um DVD utiliza 24 bits por amostra.

A precisão com que um conversor analógico-digital pode medir a amplitude ou o volume do sinal é onde obtemos a profundidade de bits.

Gosto frequentemente de pensar na profundidade de bits como as pequenas marcas numa fita métrica. A profundidade de bits mais baixa pode ser as marcas em polegadas, que estão muito mais afastadas, enquanto a profundidade de bits mais elevada pode ser as marcas em centímetros. Essencialmente, uma maior profundidade de bits tem em conta um maior número de medições individuais mais pequenas.

Compreender a taxa de bits

A taxa de bits é a quantidade de dados produzidos por um ficheiro em cada segundo.

Quando ouve áudio digital, verá ficheiros que têm uma marca "kbps" no final para lhe indicar a taxa de bits que lhe está associada.

Cada segundo de uma gravação áudio contém uma quantidade definida de bits. Calculamos estes bits por "dados por segundo". Por exemplo, se vir um ficheiro de áudio com a indicação "280 kbps", isso significa que existem 280 kilobits em cada segundo de áudio nesse fluxo.

Utilizamos a taxa de bits, que é a quantidade de dados codificados por segundo, para determinar a qualidade de um formato de ficheiro.

Embora se obtenham ficheiros comprimidos mais pequenos com definições de taxa de bits mais baixas, a qualidade de áudio não é tão elevada. Quando os discos rígidos surgiram, era necessário ter áudio de baixa taxa de bits, uma vez que não tínhamos o tipo de capacidade de armazenamento que temos atualmente. O mesmo acontecia com a maioria dos computadores, que não tinham largura de banda para transmitir ficheiros maiores.

No mundo digital moderno, a largura de banda e o armazenamento não são questões com que nos tenhamos de preocupar, razão pela qual se recomenda sempre a utilização da taxa de bits mais elevada possível quando se trabalha com formatos com perdas.

Por exemplo, se estiver a trabalhar com um MP3, a norma para alta qualidade é 320 kbps. Com estas definições de alta qualidade, pode ser bastante difícil diferenciar o áudio comprimido do áudio não comprimido quando se ouve casualmente.

Compreender o áudio de alta resolução

Agora, podem estar a pensar,

E quanto ao áudio de alta resolução?

O áudio de alta resolução é único, na medida em que não existe uma norma única para ele.

No entanto, quando os produtores e engenheiros falam de áudio de alta resolução, referem-se frequentemente a ficheiros de áudio com frequências de amostragem ou profundidade de bits acima do padrão de CD, que é de 16 bits/44,1 kHz.

A nosso ver, os ficheiros de alta resolução são de 24 bits/48 kHz, 24 bits/96 kHz e 24 bits/192 kHz.

A vantagem dos ficheiros de áudio de alta resolução é que contêm muito mais informação do que os ficheiros de baixa resolução ou áudio comprimido, o que significa que a qualidade do som é muito melhor. Embora o áudio de alta resolução ocupe mais espaço de armazenamento, pode valer a pena se a qualidade for a que procura.

Alguns dos ficheiros de áudio de alta resolução não comprimidos mais populares incluem WAV e AIFF, embora também existam formatos de áudio FLAC e ALAC.

Formatos de ficheiros áudio comuns

Embora existam vários formatos de ficheiros de áudio diferentes, nem todos são muito comuns.

No seu percurso de produção musical em geral, é provável que só se depare com alguns tipos de formatos de áudio diferentes. Aqui estão alguns dos principais que deve conhecer:

MP3

O formato de áudio mais comum para audição casual é o MP3.

No início da década de 2000, os MP3 subiram de popularidade, tudo graças à revolução da partilha de ficheiros iniciada pelo Napster. Em outubro de 2001, Steve Jobs tirou um pequeno dispositivo do bolso com 1.000 destes ficheiros.

O que era tão bom nos MP3 era a quantidade de informação que conseguíamos armazenar em contentores tão pequenos, mantendo a qualidade do som.

É claro que uma das razões pelas quais os MP3 estavam no centro do download ilegal de música era o facto de serem fáceis de codificar a partir de CDs.

No mundo de hoje, os MP3 continuam a ser um dos formatos de ficheiro de áudio mais comuns. Mesmo as principais lojas de descarregamento de áudio digital, como a Bandcamp, ainda utilizam o MP3 como formato principal.

São alguns dos ficheiros mais práticos para armazenar música em tablets ou dispositivos de reprodução portáteis. Além disso, os MP3 funcionam em praticamente todos os dispositivos de reprodução.

A taxa de bits a que os MP3 são gravados pode ter um grande impacto na qualidade do som. Por exemplo, um MP3 com codificação de 128 kbps terá uma qualidade de som inferior a um MP3 com codificação de 320 kbps.

Veja abaixo para ter uma ideia do tamanho dos ficheiros MP3 em relação a outros tipos de ficheiros:

Comparação do tamanho do ficheiro

FLAC/ALAC/WMA

Os ficheiros FLAC são ficheiros áudio comprimidos sem perdas e de código aberto. Este formato de ficheiro áudio foi um dos primeiros formatos sem perdas a ser utilizado popularmente. FLAC significa Free Lossless Audio Codec. Estes ficheiros têm cerca de metade do tamanho de um ficheiro WAV ou AIFF normal com uma taxa de amostragem igual.

No entanto, não há perda de qualidade de áudio com ficheiros FLAC. São melhores do que a qualidade de CD, uma vez que oferecem uma resolução até 32 bits/96 kHz.

A vantagem dos ficheiros FLAC é que permitem aos utilizadores com armazenamento limitado nos seus dispositivos de audição desfrutar de áudio sem perdas. Embora possa ser difícil para o ouvinte médio perceber a diferença entre FLAC e MP3, muitos audiófilos são rápidos a debater as diferenças.

O ALAC é muito semelhante ao FLAC, embora tenha sido desenvolvido pela Apple. Este tipo de ficheiro significa Apple Lossless Audio Codec.

O ALAC é uma excelente alternativa ao FLAC para utilizadores de Apple Music ou iOS. No entanto, tenha em atenção que os ficheiros ALAC são ligeiramente maiores do que os ficheiros FLAC.

A alternativa do Windows é o WMA, que significa Windows Media Audio. Esta alternativa foi desenvolvida pela Microsoft para o sistema operativo Windows. O WMA pode lidar com taxas de amostragem até 24-bit/96kHz, reproduzindo-as sem remover dados.

Note-se que o Windows também desenvolveu um formato WMA com perdas, que pode valer a pena considerar se tiver um computador com Windows e quiser reduzir o tamanho dos ficheiros enquanto desfruta de uma maior fidelidade de áudio do que o MP3.

AAC

Os ficheiros AAC são ficheiros de áudio comprimidos com perdas que foram criados por várias empresas de tecnologia digital, incluindo a Bell, a Microsoft e a Dolby. A ideia subjacente à criação do formato de ficheiro de áudio AAC é que era suposto ser mais eficiente do que o MP3.

Se já teve um iPod, então já ouviu o formato de ficheiro de áudio AAC, uma vez que a loja iTunes utiliza ficheiros AAC.

O AAC é um pouco mais eficiente do que o MP3, e muitos dizem que soa melhor. É utilizado na plataforma de streaming da Apple Music, bem como na plataforma de streaming do YouTube.

WAV/AIFF

Os ficheiros WAV (Waveform Audio File Format) são um dos formatos de áudio sem perdas e sem compressão mais comuns. As pessoas também utilizam frequentemente ficheiros AIFF em vez de ficheiros WAV, uma vez que ambos os tipos de ficheiros têm a mesma quantidade de informação. Em essência, eles têm um desempenho muito semelhante.

Ambos os ficheiros são baseados em PCM ou modulação de código de impulsos, que é um dos métodos mais simples de mecanismo de armazenamento de áudio no mundo digital.

A diferença é que os ficheiros WAV foram desenvolvidos para utilizadores de PC pela IBM e pela Microsoft, razão pela qual os encontrará em plataformas baseadas no Windows. O WAV é também o formato de codificação padrão para CDs.

Por outro lado, os ficheiros AIFF (Audio Interchange File Format) foram desenvolvidos para os utilizadores da Apple como alternativas ao WAV. Não são tão amplamente utilizados como os ficheiros WAV, embora tenham um suporte muito melhor para metadados. Ao contrário de um ficheiro WAV, é possível incluir dados como títulos de músicas e ilustrações em ficheiros AIFF.

Os ficheiros AIFF utilizam modulação de código de pulso, o que significa que não comprimem nem perdem informação pelo caminho. Se gravar no Logic, pode reparar que o AIFF é uma das poucas opções que tem.

É claro que pode utilizar qualquer um dos formatos em cada plataforma.

A principal desvantagem destes dois tipos de ficheiros é o facto de serem muito grandes. Um ficheiro com qualidade de CD de 16 bits/44,1 kHz ocupa, em média, cerca de 10 MB de espaço por cada minuto de áudio.

Dito isto, são os dois ficheiros de eleição para os engenheiros de áudio que pretendem um áudio que mantenha a mais elevada qualidade de som.

OGG Vorbis

Os ficheiros OGG Vorbis, muitas vezes referidos como o formato Vorbis, são ficheiros de código aberto com perdas que foram criados como alternativas aos ficheiros AAC e MP3. A particularidade deste formato é o facto de não estar restringido por qualquer patente. O serviço de streaming do Spotify utiliza o formato OGG Vorbis a 320 kbps.

OGG não significa nada de facto. De facto, o OGG não é um formato de compressão. Pelo contrário, é um contentor multimédia único, concebido para conter uma vasta gama de formatos de compressão. A razão pela qual é comummente chamado OGG Vorbis é que o OGG contém normalmente ficheiros Vorbis.

O Vorbis surgiu pela primeira vez no ano 2000. Tornou-se um formato de áudio popular porque aderiu ao software de código aberto. Além disso, em comparação com a maioria dos formatos de compressão com perdas, proporciona uma qualidade de áudio superior.

Outros tipos de formatos de áudio menos comuns

DSD

O DSD é um formato de áudio de alta resolução que é utilizado para Super Audio CDs. Encontrará o DSD em diversas variedades, incluindo 2,8, 5,6 e 11,2 MHz. É um ficheiro de áudio de alta fidelidade e não comprimido que é ótimo para uma audição de qualidade, embora não seja o formato de ficheiro de áudio mais prático para streaming.

A particularidade dos ficheiros DSD é que apenas utilizam um único bit, ao contrário dos ficheiros não comprimidos que utilizam uma profundidade de bits e uma taxa de amostragem. Estes ficheiros amostram esse único bit 2,8 milhões de vezes por segundo para recriar o ficheiro.

Os ficheiros DSD são muito semelhantes aos ficheiros de alta resolução de 24 bits/96 kHz. No entanto, embora este formato inovador tenha uma qualidade de som incrível, não é muito compatível com muitos sistemas operativos. De facto, é necessário utilizar um conversor D/A de terceiros para utilizar um ficheiro DSD num sistema Mac ou Windows.

Se tiver um pouco de dinheiro extra para gastar num conversor D/A externo e gostar do som da amostragem de um único bit 2,8 milhões de vezes por segundo, pode valer a pena considerar o DSD.

MQA

O MQA é outro formato de compressão de áudio sem perdas de alta resolução que foi criado para um streaming mais eficiente. O Tidal utiliza o MQA para o streaming de alta resolução, e muitos CDs também o utilizam.

Como escolher um formato de ficheiro áudio

Formatos de ficheiros de masterização áudio

Portanto, nesta altura, tem toneladas de informação sobre o formato dos ficheiros áudio armazenados no seu cérebro.

O que é que se faz com ele?

A escolha do formato de áudio correto para a aplicação em causa pode fazer uma grande diferença.

O formato de áudio que optar por utilizar dependerá do facto de preferir a qualidade do som ou o espaço de armazenamento. Para além disso, também dependerá dos dispositivos que está a utilizar para reprodução.

Se for um ouvinte generalista, pode desfrutar de formatos de ficheiros comprimidos com taxas de bits elevadas, como AAC ou MP3 de 320 kbps.

Por outro lado, se for um produtor musical ou engenheiro de gravação, vai querer utilizar ficheiros de áudio não comprimidos com taxas de amostragem elevadas. Um dos mais populares é o WAV e o AIFF de 24 bits/48 kHz.

No entanto, para uma audição séria e crítica, muitos audiófilos recomendam o FLAC.

Resumindo os formatos de áudio

No fim de contas, não existe um "melhor formato áudio".

A preferência pessoal é o principal fator para encontrar o formato de áudio certo para si.

É importante ter algumas coisas em mente, incluindo o seu espaço de armazenamento, o seu sistema operativo e a forma como pretende percecionar a sua música.

É claro que, embora ter um pouco de espaço de armazenamento extra seja certamente agradável, nunca recomendamos sacrificar a qualidade de áudio por isso, especialmente se o seu objetivo é ser o melhor engenheiro de áudio possível.

Esperamos que possa utilizar este guia como referência sempre que se deparar com um tipo de ficheiro sobre o qual não tenha a certeza, uma vez que o conhecimento dos vários tipos de formatos de áudio disponíveis fará de si um produtor ou engenheiro mais fiável a longo prazo.

Dê vida às suas músicas com uma masterização de qualidade profissional, em segundos!