48kHz vs. 96kHz: Qual deles utilizar e porquê?

48kHz vs. 96kHz: Qual deles utilizar e porquê? 48kHz vs. 96kHz: Qual deles utilizar e porquê?

Se alguma vez andou a bisbilhotar nas definições da sua DAW e ficou estupefacto com a variedade de taxas de amostragem oferecidas, não é o único. Alguns dos principais DAWS (Logic Pro e Pro Tools, por exemplo) oferecem seis taxas de amostragem à escolha: 44.1, 48, 88.2, 96, 176.4 e 192.

Caso não esteja familiarizado, a taxa de amostragem é a resolução a que o áudio é gravado e, no caso dos instrumentos virtuais, produzido. Tendo isto em conta, seria de esperar que maior fosse melhor, certo?

Não necessariamente.

Embora a maior parte das discussões sobre taxas de amostragem se centrem nos limites da audição humana, existem outros factores a ter em consideração ao escolher a taxa de amostragem a gravar.

E é aí que nós entramos. Este artigo vai dar um mergulho profundo (e eu quero dizer, profundo) nos zeros e uns do áudio digital. Complexo? Em alguns pontos, sim. Mas no final deste artigo saberá os prós e contras de gravar a 48kHz vs 96kHz, e será capaz de decidir qual é o melhor para si.

Compreender as taxas de amostragem

Escolher taxas de amostragem no Logic Pro

Imagine que um carro passa por sua casa. Viaja da esquerda para a direita e passa pela casa do seu vizinho num movimento contínuo. Isso é o equivalente ao som no mundo analógico - a forma de onda é um som contínuo.

Agora, imagine que quer reproduzir esse carro em movimento. Decide fazer uma animação flip-book do veículo a deslocar-se da esquerda para a direita. Quantas mais imagens fizer do carro em movimento, mais pormenorizado e suave parecerá o movimento.

É assim que o áudio digital funciona; tira uma série de fotografias (ou amostras) da forma de onda analógica a velocidades super-rápidas, de modo a replicá-la no mundo digital.

As taxas de amostragem referem-se à frequência com que esses instantâneos são captados em cada segundo; uma taxa de amostragem de 44,1 kHz significa que são captadas 44.100 amostras da forma de onda de entrada em cada segundo. Taxas de amostragem mais elevadas resultam na captação de mais instantâneos. Mas será que conseguimos ouvir esse detalhe extra?

Teorema de Nyquist

Foto de Saad Ahmad no Unsplash

Um jovem inteligente chamado Harry Nyquist descobriu que a taxa de amostragem tem de ser, pelo menos, o dobro da frequência mais elevada que está a ser gravada. Isto é conhecido como a frequência de Nyquist, ou limite de Nyquist.

Uma vez que os seres humanos podem ouvir uma frequência máxima de cerca de 20 kHz, é necessária uma taxa de amostragem mínima de 40 kHz para captar todas as frequências audíveis.

A tentativa de registar frequências acima deste limite conduz a aliasing ou foldover. As frequências mais altas são mal representadas como frequências mais baixas, levando a distorção ou artefactos no sinal reconstruído.

Todos os conversores analógico-digitais modernos têm filtros anti-aliasing para remover quaisquer artefactos, actuando essencialmente como um filtro passa-baixo para remover quaisquer frequências altas que possam ter alias. A gravação com taxas de amostragem mais elevadas permite que estes filtros funcionem sem cortar quaisquer frequências audíveis.

Em termos simples, o teorema de Nyquist é uma regra de "quanto é suficiente" para a gravação digital.

O surgimento do áudio com qualidade de CD

A norma de qualidade de CD de 44,1 kHz surgiu nos primórdios do áudio digital, quando os discos rígidos não estavam à altura de armazenar o material de um álbum e os gravadores de vídeo foram reaproveitados para o efeito.

Com base na taxa de fotogramas e nas linhas utilizáveis por fotograma, as cabeças de lápis costumavam armazenar 3 amostras de áudio por fotograma, o que resultava numa taxa de amostragem de 44,1 kHz. Esta era a taxa de amostragem mínima possível que estava em conformidade com a teoria de Nyquist e permitia que o master fosse armazenado em cassete de vídeo. Tornou-se naquilo a que atualmente chamamos áudio com qualidade de CD.

Transformada de Fourier

Um espetrograma em ação!

As taxas de amostragem não afectam apenas a forma como um sinal é captado; afectam também a forma como o áudio digital é "lido".

A transformada de Fourier é uma ferramenta matemática usada para analisar um sinal complexo e dividi-lo em formas de onda simples em diferentes frequências. É assim que plugins como EQs, espectrogramas e deteção de pitch funcionam, analisando todo o sinal e dividindo-o em bandas menores.

Tudo isto para dizer que, quanto mais informação um ficheiro de áudio tiver em termos de instantâneos por segundo (taxas de amostragem mais elevadas), mais precisos serão os cálculos da transformada de Fourier.

Resposta de frequência

Foto de Saketh no Unsplash

Outro fator a considerar ao discutir as taxas de amostragem é o equipamento em que está a gravar e a monitorizar.

Todas as peças de áudio têm uma resposta de frequência, que pode ser descrita livremente como:

  • Que frequências pode reproduzir, e
  • a precisão com que o faz.

Se usar um microfone da Radioshack para fazer um take numa guitarra da treta e o reproduzir num par de colunas da Radioshack da treta, é provável que não soe bem. Independentemente da taxa de amostragem utilizada.

Leve-me mais alto

Depois de passar por todo este material científico, podemos ver que taxas de amostragem mais elevadas permitem-nos captar frequências mais elevadas e analisá-las com maior detalhe.

Mas embora gravar a 96 kHz signifique que podemos captar frequências até 48 kHz, do ponto de vista da audição humana não existe uma diferença audível real em relação a uma gravação a 44,1 kHz. Mesmo para as pessoas com uma audição excecional, as frequências superiores continuarão a estar fora do alcance audível.

E graças à teoria de Nyquist, sabemos que 44,1 kHz é mais do que suficiente para reproduzir na perfeição qualquer sinal dentro da gama de audição humana.

Então, porque é que utilizamos taxas de amostragem mais elevadas?

48kHz: O padrão da indústria

Foto de Thibault Penin no Unsplash

Quando se trata de filmes, TV e streaming, 48 kHz tornou-se a taxa de amostragem amplamente aceite para entrega. Embora estejam disponíveis taxas de amostragem mais elevadas, os 48 kHz garantiram o seu lugar como padrão na indústria dos media graças ao seu equilíbrio entre qualidade, eficiência e compatibilidade.

Porque é que 48 kHz é o ideal?

A principal razão para a adoção de uma taxa de amostragem de 48 kHz como norma na produção de meios de comunicação prende-se com a compatibilidade. A taxa de amostragem funcionava bem com os diferentes sistemas de vídeo baseados em fotogramas utilizados pela televisão europeia e NTSC e, ao mesmo tempo, cumpria os requisitos de frequência de Nyquist.

Hoje em dia, plataformas de streaming como a Netflix, a Disney e a Amazon exigem que o áudio seja entregue a 48 kHz e, mesmo que esteja a marcar um filme real da velha guarda para lançamento nos cinemas, ser-lhe-á exigido que entregue hastes de 48 kHz para a fase de mistura.

Benefícios da utilização de uma taxa de amostragem de 48kHz

Outra razão pela qual os 48 kHz se tornaram uma taxa de amostragem amplamente aceite é o seu equilíbrio entre um som excelente e as exigências de processamento.

Anti-Aliasing

A frequência de amostragem ligeiramente superior permite uma maior margem de manobra para os filtros anti-aliasing funcionarem. Em taxas de amostragem de 44,1 kHz, um filtro anti-aliasing menos que perfeito pode introduzir artefactos subtis mas mensuráveis.

Por outro lado, quando se utilizam taxas de amostragem de 48 kHz, qualquer aliasing que ocorra estará fora do espetro audível.

Reamostragem

Dada a utilização generalizada da taxa de amostragem mais elevada na indústria dos media, a entrega de áudio a 48 kHz minimiza a necessidade de reamostragem. Embora 44,1 kHz seja uma prática comum na indústria musical, se estiver a trabalhar com licenças de sincronização, o produto final terá de ser entregue a 48 kHz.

O processo de conversão da taxa de amostragem ao efetuar o upsampling de taxas de amostragem inferiores para 48 kHz pode levar à introdução de artefactos indesejados no ficheiro. Por conseguinte, é sempre uma boa ideia gravar com uma taxa de amostragem de qualidade superior e reduzir a amostragem mais tarde, se necessário, por exemplo, ao imprimir para CD.

Tamanho do ficheiro

A gravação e o processamento de áudio a 48 kHz mantêm os tamanhos dos ficheiros geríveis, o que é essencial para grandes projectos televisivos e cinematográficos em que os custos de armazenamento e os tempos de transferência de dados são um fator importante.

Limitações da utilização de uma taxa de amostragem de 48 kHz

Existem de facto muito poucas limitações à utilização de 48 kHz. Embora exista algum debate na comunidade de áudio sobre se é verdadeiramente "suficientemente bom" para todas as aplicações profissionais, a diferença entre 48 kHz e uma taxa de amostragem mais elevada só é muitas vezes percetível em ambientes de audição muito controlados e de topo de gama.

96 kHz: Áudio de alta resolução

Gerado por IA - por favor, substitua!

Embora uma taxa de amostragem de 48 kHz seja a norma da indústria para filmes, televisão, podcasts e afins, alguns engenheiros preferem trabalhar a 96 kHz. As vantagens teóricas incluem mais espaço para captar conteúdo de alta frequência, aliasing reduzido e capacidades de processamento melhoradas.

Vantagens teóricas

Gama de gravação alargada

Uma taxa de amostragem de 96 kHz permite a gravação de frequências até 48 kHz. Embora isto esteja muito para além do alcance da audição humana (que normalmente atinge os 20 kHz), algumas pessoas argumentam que este conteúdo de frequência ultra-alta interage com o som de formas subtis que os humanos ainda conseguem ouvir.

Aliasing reduzido

Lembra-se do limite de Nyquist? A gravação a 96 kHz empurra esse limite até 48 kHz, reduzindo assim as hipóteses de artefactos de aliasing interferirem com qualquer som audível.

Melhor processamento de plugins

Taxas de amostragem elevadas podem também resultar num melhor processamento para alguns efeitos. Isto é particularmente notório quando o áudio é esticado no tempo, ou quando se efectuam tarefas de pitch-shifting.

O estiramento temporal do áudio gravado a taxas de amostragem mais elevadas resulta num som mais limpo, com uma qualidade de som mais natural. É por esta razão que muitos designers de som trabalham com uma taxa de amostragem ainda mais elevada (192 kHz).

O mesmo se aplica ao processamento como a saturação e a distorção. Estes plugins adicionam conteúdo adicional de alta frequência acima do limite Nyquist original, pelo que uma taxa de amostragem de 96 kHz resultará numa menor oportunidade de ocorrência de aliasing após o efeito.

Medição mais exacta do pico da amostra

Outra vantagem de trabalhar a 96 kHz é a precisão melhorada da medição do pico da amostra. Muitas vezes, o pico de um sinal ocorre entre as amostras que foram gravadas - conhecido como picos interamostras. Um engenheiro de mistura obterá uma representação mais exacta de onde se encontram os picos do sinal com uma taxa de amostragem mais elevada que contenha mais amostras por segundo.

Qualidade de áudio à prova de futuro

Outra vantagem percebida da gravação a 96 kHz é manter-se à frente do jogo. À medida que a tecnologia continua a evoluir, taxas de amostragem mais elevadas podem tornar-se a norma e alguns engenheiros escolhem 96 kHz para garantir a compatibilidade com futuros formatos de alta resolução.

Desvantagens de usar uma taxa de amostragem de 96 kHz

A gravação a 96 kHz tem muitas vantagens teóricas e pode resultar num áudio de melhor qualidade quando se estica o tempo e se executam tarefas de edição. Mas estas vantagens têm compensações práticas em comparação com a utilização de uma taxa de amostragem inferior.

Tamanho do ficheiro

Sempre que duplicar uma taxa de amostragem, a quantidade de dados gerados também duplica. Uma sessão gravada a 96 kHz ocupará o dobro do espaço de uma sessão a 48 kHz devido aos ficheiros muito maiores que são criados.

Para projectos complexos, isto pode rapidamente aumentar os requisitos de armazenamento e tornar as cópias de segurança, a partilha e a gestão de ficheiros mais difíceis.

Poder de processamento

Como seria de esperar, uma taxa de amostragem mais elevada exige mais energia da sua CPU. A menos que você tenha uma máquina super-jazzy up, você pode achar que sua sessão sofre de aumento de latência, tempos de renderização mais lentos e instabilidade do sistema.

Desempenho DAW

Embora a maioria das DAWs suporte taxas de amostragem mais altas, executar uma sessão a 96 kHz ou mais significa que a DAW tem de trabalhar mais para transmitir áudio. Dependendo do seu sistema e da complexidade da sessão, existe um risco acrescido de falhas ou falhas. Não é o ideal quando se está a misturar o próximo êxito.

Desempenho do plug-in

Alguns plug-ins sobreamostram internamente o sinal de entrada para melhorar a qualidade da saída resultante, por exemplo, plug-ins de medição ou limitadores. Executá-los numa taxa de amostragem já elevada pode prejudicar o desempenho da CPU.

Eficiência do fluxo de trabalho

Embora as taxas de amostragem mais elevadas possam oferecer vantagens teóricas e uma preparação para o futuro, a execução de uma sessão a uma taxa mais elevada pode tornar o seu fluxo de trabalho mais lento sem quaisquer vantagens visíveis.

  • Algumas interfaces de áudio económicas não conseguem lidar com taxas de amostragem de 96 kHz, o que pode levar a distorções no som.
  • Terá quase sempre de reduzir a amostragem para criar resultados finais, criando passos de conversão desnecessários ao longo do caminho.
  • Se o seu sistema tiver dificuldades em executar uma sessão com uma taxa de amostragem mais elevada, as coisas irão inevitavelmente demorar mais tempo. A mistura tornar-se-á entediante e terá ainda de reduzir a amostragem posteriormente.

É possível ouvir a diferença entre 48 kHz e 96 kHz?

Foto de Mark Paton no Unsplash

A pergunta de um milhão de dólares nesta discussão é: as pessoas conseguem realmente ouvir a diferença entre 48 kHz e 96 kHz?

Depende de quem pergunta.

Alguns ouvintes treinados, nomeadamente engenheiros de masterização e audiófilos, afirmam ser capazes de ouvir diferenças subtis entre taxas de amostragem, especialmente se se tratar de um instrumento com o qual estão altamente sintonizados.

Algumas pessoas argumentam que, mesmo que não consigamos ouvir a diferença entre as duas taxas de amostragem, a existência de conteúdo ultrassónico no som pode ter um impacto na experiência de audição devido à interação harmónica.

Se isto se deve a diferenças sónicas reais ou apenas a um preconceito psicológico, é discutível. Mas há algumas coisas que afectam a forma como ouvimos o som.

Sistemas de reprodução

Lembra-se da discussão sobre a resposta de frequência? Mesmo que tenha uma audição super-humana, muito para além da gama dos 20 kHz, se as colunas em que está a ouvir não suportarem estas frequências ultra-sónicas, a taxa de amostragem mais elevada torna-se efetivamente inútil.

Limitações da audição humana

A maioria dos adultos sofre uma degradação nas gamas superiores da sua audição à medida que envelhecem. Mesmo que as frequências ultra-altas estejam presentes num som, há uma boa hipótese de muitos ouvintes não as conseguirem ouvir.

Considerações práticas

Podemos resumir esta discussão a duas ideias:

  • 48 kHz é a norma da indústria dos media e preenche todos os requisitos sonoros.
  • 96 kHz parece um pouco fixe, mas também vem com muita bagagem.

A escolha da taxa de amostragem correta para o seu projeto depende das suas necessidades específicas e do seu fluxo de trabalho. Eis uma análise prática para diferentes domínios da produção áudio.

Produção musical: Gravação, mistura e masterização

Quando se trabalha apenas com música, a escolha da taxa de amostragem resume-se ao equilíbrio entre a qualidade de áudio e a eficiência do sistema.

  • Gravação: Alguns engenheiros gostam de gravar com taxas de amostragem elevadas de 96 kHz ou superiores para captar todos os detalhes sonoros e para evitar erros de aliasing. No entanto, para a maior parte da música, 48 kHz é mais do que suficiente e é menos exigente para as capacidades do sistema e armazenamento. Além disso, elimina a necessidade de utilizar um relógio mestre para manter tudo sincronizado.
  • Mistura e masterização: Atualmente, muitos plugins oferecem uma sobreamostragem interna para proporcionar uma saída mais precisa, pelo que trabalhar a 48 kHz continua a proporcionar um elevado nível de áudio.
  • Entrega final: As plataformas de streaming tendem a aceitar ficheiros com uma taxa de amostragem de 44,1 ou 48 kHz. Se a música for reproduzida em CD, a mistura final necessitará de uma conversão da taxa de amostragem para 44,1 kHz. De qualquer forma, gravar com taxas de amostragem elevadas é um exagero nestas situações.

Áudio para cinema e televisão

Quando se trabalha em cinema e televisão (incluindo licenciamento de sincronização ), 48 kHz é o padrão de ouro. Na maioria dos casos, a resolução de profundidade de bits terá de ser de 16 bits, embora seja uma boa ideia gravar com uma profundidade de bits de 24 para começar e reduzir para a entrega.

Dado o elevado número de faixas presente nas sessões de pós-produção, a gravação a 96 kHz pode apresentar problemas de eficiência do sistema e de espaço de armazenamento.

Jogos e RV

O áudio em cenários de jogos e realidade virtual exige frequentemente taxas de amostragem mais elevadas devido às exigências únicas do formato.

Muitas vezes, é necessário efetuar extensões temporais e mudanças de tom dos sons, pelo que é preferível gravar a 96 kHz.

Som e transmissão em direto

Em situações ao vivo, o desempenho em tempo real é a principal prioridade, tornando 48 kHz a melhor escolha.

Recomendações finais

Como regra geral, a forma mais eficiente e eficaz de gravar áudio é com uma profundidade de bits de 24 e uma taxa de amostragem de 48 kHz.

Estas definições são um ponto ideal entre clareza sonora e eficiência no armazenamento e desempenho da CPU.

Muitos plugins já efectuam uma sobreamostragem interna enquanto trabalham com estas taxas, o que significa que as vantagens de gravar a 96 kHz são insignificantes.

Além disso, os limitadores e medidores digitais de alta qualidade compensam os picos entre amostras, reduzindo a necessidade de taxas de amostragem mais elevadas.

Por fim, 48 kHz é uma norma da indústria para a maioria dos trabalhos profissionais, o que garante uma integração perfeita com colaboradores e distribuidores.

As poucas situações em que pode valer a pena considerar a utilização de 96 kHz para gravar são quando:

  • um projeto requer extensos alongamentos temporais, mudanças de tom ou edição (como a síntese granular).
  • um projeto é para fins de arquivo e pretende-se preparar o trabalho para o futuro.

Conclusão

Já percorremos muito terreno! Aqui está uma rápida recapitulação do que foi abordado. As notas de rodapé, se preferir:

  • Uma taxa de amostragem de 44,1 kHz é capaz de reproduzir perfeitamente sinais de áudio até às frequências mais altas dentro do alcance da audição humana.
  • A indústria televisiva, cinematográfica e dos media utiliza 48 kHz como norma.
  • A gravação a 96 kHz requer mais capacidade de processamento e mais espaço em disco para armazenar os ficheiros maiores resultantes.
  • A utilização de taxas de amostragem cada vez mais elevadas resulta em rendimentos decrescentes em relação à eficiência do sistema e aos custos de armazenamento.
  • Se sabe que vai utilizar o alongamento de tempo e outras funções de edição no seu áudio, grave a 96 kHz para obter melhores resultados.

Lembre-se, o contexto em que está a trabalhar é mais importante do que perseguir números.

Se é um artista, o seu público pode não se importar com o facto de ter produzido uma faixa a 96 kHz. De facto, é pouco provável que ouçam a diferença entre isso e algo captado a 44,1 kHz.

Se estiver a gravar música para filmes e televisão, 48 kHz é o equilíbrio perfeito entre qualidade de som e padrões profissionais.

E se estiver a construir uma biblioteca de sons para uma biblioteca de efeitos, 96 kHz é a melhor opção para permitir o máximo de capacidades de edição.

Em última análise, a decisão é sua. Faça experiências com diferentes taxas de amostragem e veja o que lhe soa bem. Se ouvir uma diferença notável a 96 kHz, vá em frente! (Mas talvez compre um disco rígido maior...).

Independentemente do que acabar por utilizar, vá em frente e faça a música!

Dê vida às suas músicas com uma masterização de qualidade profissional, em segundos!