Se você já deu uma olhada nas configurações de DAW e ficou surpreso com a variedade de taxas de amostragem oferecidas, não está sozinho. Algumas das principais DAWS (Logic Pro e Pro Tools, por exemplo) oferecem seis taxas de amostragem para você escolher: 44,1, 48, 88,2, 96, 176,4 e 192.
Caso você não esteja familiarizado, a taxa de amostragem é a resolução na qual o áudio é gravado e, no caso de instrumentos virtuais, produzido. Diante disso, você pensaria que maior era melhor, certo?
Não necessariamente.
Embora a maioria das discussões sobre as taxas de amostragem esteja centrada nos limites da audição humana, há alguns outros fatores a serem levados em consideração ao escolher em qual taxa de amostragem gravar.
E é aí que entramos. Este artigo abordará profundamente (e quero dizer, profundamente) os zeros e uns do áudio digital. Complexo? Em alguns lugares, sim. Mas, no final deste artigo, você conhecerá os prós e os contras de gravar em 48 kHz versus 96 kHz e poderá decidir qual é a melhor para você.
Compreendendo as taxas de amostragem

Imagine que há um carro passando pela sua casa. Ele viaja da esquerda para a direita e passa pela casa do seu vizinho em um movimento contínuo. Isso é o equivalente ao som no mundo analógico — a forma de onda é um som contínuo.
Agora digamos que você queira replicar aquele carro em movimento. Você decide fazer uma animação em flip-book do veículo viajando da esquerda para a direita. Quanto mais fotos você tirar desse carro em movimento, mais detalhado e suave será o movimento.
É assim que o áudio digital funciona; ele tira uma série de fotos (ou amostras) da forma de onda analógica em velocidades super rápidas para replicá-la no mundo digital.
As taxas de amostragem referem-se à frequência com que esses instantâneos são tirados a cada segundo; uma taxa de amostragem de 44,1 kHz significa que há 44.100 amostras da forma de onda de entrada sendo coletadas a cada segundo. Taxas de amostragem mais altas resultam na captura de mais instantâneos. Mas podemos ouvir esse detalhe extra?
Teorema de Nyquist

Um jovem inteligente chamado Harry Nyquist descobriu que a taxa de amostragem precisa ser pelo menos o dobro da frequência mais alta registrada. Isso é conhecido como frequência de Nyquist ou limite de Nyquist.
Como os humanos podem ouvir uma frequência máxima de cerca de 20 kHz, é necessária uma taxa mínima de amostragem de 40 kHz para capturar todas as frequências audíveis.
Tentar gravar frequências acima desse limite resulta em aliasing ou dobragem. As frequências mais altas são deturpadas como frequências mais baixas, causando distorção ou artefatos no sinal reconstruído.
Todo conversor digital-analógico moderno tem filtros anti-aliasing para remover quaisquer artefatos, atuando essencialmente como um filtro passa-baixo para remover quaisquer frequências altas que possam causar aliases. A gravação em taxas de amostragem mais altas permite que esses filtros operem sem cortar nenhuma frequência audível.
Em termos simples, o teorema de Nyquist é uma regra de “quanto é suficiente” para gravação digital.
O surgimento do áudio com qualidade de CD
O padrão de qualidade de CD de 44,1 kHz surgiu nos primórdios do áudio digital, quando os discos rígidos não estavam à altura de armazenar o material de um álbum e os gravadores de vídeo foram reutilizados para esse trabalho.
Com base na taxa de quadros e nas linhas utilizáveis por quadro, as cabeças de lápis costumavam armazenar 3 amostras de áudio por quadro, resultando em uma taxa de amostragem de 44,1 kHz. Essa era a taxa de amostragem mínima possível que estava de acordo com a teoria de Nyquist e permitia que o master fosse armazenado em fita de vídeo. Tornou-se o que agora chamamos de áudio com qualidade de CD.
Transformada de Fourier

As taxas de amostragem não afetam apenas a forma como um sinal é capturado; elas também afetam a forma como o áudio digital é “lido”.
A transformada de Fourier é uma ferramenta matemática usada para analisar um sinal complexo e dividi-lo em formas de onda simples em diferentes frequências. É assim que plug-ins como equalizadores, espectrogramas e detecção de tom funcionam, analisando todo o sinal e dividindo-o em bandas menores.
Tudo isso para dizer que quanto mais informações um arquivo de áudio tiver em termos de instantâneos por segundo (taxas de amostragem mais altas), mais precisos serão os cálculos da transformada de Fourier.
Resposta de frequência

Outro fator a ser considerado ao discutir as taxas de amostragem é o equipamento em que você está gravando e monitorando.
Cada peça de gubbins de áudio tem uma resposta de frequência, que pode ser descrita vagamente como:
- Quais frequências ele pode reproduzir e
- com que precisão ele faz isso.
Se você usa um microfone Radioshack de baixa qualidade para tocar uma guitarra de baixa qualidade e tocá-la em um par de alto-falantes de baixa qualidade da Radioshack, é provável que não soe bem. Não importa qual taxa de amostragem você usa.
Leve-me mais alto
Depois de examinar todo esse material científico, podemos ver que taxas de amostragem mais altas nos permitem capturar frequências mais altas e analisá-las com mais detalhes.
Mas, embora gravar a 96 kHz signifique que podemos capturar frequências de até 48 kHz, do ponto de vista da audição humana, não há diferença audível real em uma gravação de 44,1 kHz. Mesmo para aquelas pessoas com audição excepcional, as frequências altas ainda estarão fora da faixa audível.
E graças à teoria de Nyquist, sabemos que 44,1 kHz é mais do que suficiente para reproduzir perfeitamente qualquer sinal dentro da faixa auditiva humana.
Então, por que usamos taxas de amostragem mais altas?
48kHz: o padrão da indústria

Quando se trata de filmes, TV e streaming, 48 kHz se tornou a taxa de amostragem amplamente aceita para entrega. Embora taxas de amostragem mais altas estejam disponíveis, 48 kHz garantiu seu lugar como padrão no setor de mídia graças ao equilíbrio entre qualidade, eficiência e compatibilidade.
Por que 48 kHz é a melhor opção?
A principal razão para a adoção de uma taxa de amostragem de 48 kHz como padrão na produção de mídia foi devido à compatibilidade. A taxa de amostragem funcionou bem com os diferentes sistemas de vídeo baseados em quadros que as televisões europeias e NTSC usam e, ao mesmo tempo, atendeu aos requisitos de frequência de Nyquist.
Atualmente, plataformas de streaming como Netflix, Disney e Amazon exigem que o áudio seja entregue a 48 kHz e, mesmo se você estiver gravando a trilha sonora de um filme real da velha escola para lançamento nos cinemas, será necessário entregar gravações de 48 kHz para a fase de mixagem.
Benefícios de usar uma taxa de amostragem de 48 kHz
Outro motivo pelo qual 48 kHz se tornou uma taxa de amostragem amplamente aceita é o equilíbrio entre excelentes demandas de som e processamento.
Suavização de borda
A frequência de amostragem um pouco mais alta permite mais espaço para os filtros anti-aliasing operarem. Com taxas de amostragem de 44,1 kHz, um filtro anti-aliasing nada perfeito pode introduzir artefatos sutis, mas mensuráveis.
Por outro lado, ao usar taxas de amostragem de 48 kHz, qualquer aliasing que ocorra estará fora do espectro audível.
Reamostragem
Dado o uso generalizado da maior taxa de amostragem no setor de mídia, fornecer áudio a 48 kHz minimiza a necessidade de reamostragem. Embora 44,1 kHz seja uma prática comum na indústria musical, se você estiver trabalhando com licenciamento sincronizado, o produto final precisará ser entregue a 48 kHz.
O processo de conversão da taxa de amostragem ao aumentar a amostragem de taxas de amostragem mais baixas para 48 kHz pode levar à introdução de artefatos indesejados no arquivo. Portanto, é sempre uma boa ideia gravar com uma taxa de amostragem de maior qualidade e reduzir a resolução posteriormente, se necessário, por exemplo, ao imprimir em CD.
Tamanho do ficheiro
A gravação e o processamento de áudio a 48 kHz mantêm os tamanhos dos arquivos gerenciáveis, o que é essencial para grandes projetos de TV e filmes, nos quais os custos de armazenamento e os tempos de transferência de dados são um fator importante.
Limitações do uso de uma taxa de amostragem de 48 kHz
Na verdade, existem muito poucas limitações no uso de 48 kHz. Embora haja algum debate na comunidade de áudio sobre se ele é realmente “bom o suficiente” para todas as aplicações profissionais, a diferença entre 48 kHz e uma taxa de amostragem mais alta geralmente só é perceptível em ambientes de audição muito controlados e de última geração.
96 kHz: áudio de alta resolução

Embora uma taxa de amostragem de 48 kHz seja o padrão da indústria para filmes, programas de TV, podcasts e similares, alguns engenheiros preferem trabalhar a 96 kHz. Os benefícios teóricos incluem mais espaço para capturar conteúdo de alta frequência, redução de aliasing e recursos aprimorados de processamento.
Vantagens teóricas
Alcance de gravação estendido
Uma taxa de amostragem de 96 kHz permite a gravação de frequências de até 48 kHz. Embora isso esteja muito além da faixa de audição humana (que normalmente atinge cerca de 20 kHz), algumas pessoas argumentam que esse conteúdo de frequência ultra-alta interage com o som de maneiras sutis que os humanos ainda podem ouvir.
Aliasing reduzido
Lembra do limite de Nyquist? A gravação a 96 kHz aumenta esse limite até 48 kHz, reduzindo assim as chances de artefatos de aliasing interferirem em qualquer som audível.
Melhor processamento de plug-ins
Altas taxas de amostragem também podem resultar em um melhor processamento de alguns efeitos. Isso é particularmente perceptível ao aumentar o tempo de áudio ou realizar tarefas de mudança de tom.
O áudio prolongado gravado em taxas de amostragem mais altas resulta em um som mais limpo, com uma qualidade de som mais natural. É por isso que muitos designers de som trabalham com uma taxa de amostragem ainda maior (192 kHz).
O mesmo se aplica ao processamento, como saturação e distorção. Esses plug-ins adicionam conteúdo adicional de alta frequência acima do limite original de Nyquist, portanto, uma taxa de amostragem de 96 kHz resultará em menos oportunidades de ocorrência de aliasing após o efeito.
Medição mais precisa do pico da amostra
Outro benefício de trabalhar a 96 kHz é a maior precisão da medição do pico da amostra. Freqüentemente, o pico de um sinal ocorre entre as amostras que foram registradas - conhecido como picos entre amostras. Um engenheiro de mixagem obterá uma representação mais precisa de onde estão os picos do sinal com uma taxa de amostragem mais alta que contém mais amostras por segundo.
Qualidade de áudio preparada para o futuro
Outro benefício percebido de gravar a 96 kHz é ficar à frente do jogo. À medida que a tecnologia continua evoluindo, taxas de amostragem mais altas podem se tornar a norma, e alguns engenheiros escolhem 96 kHz para garantir a compatibilidade com futuros formatos de alta resolução.
Desvantagens de usar uma taxa de amostragem de 96 kHz
Gravar a 96 kHz tem muitas vantagens teóricas e pode resultar em áudio de melhor qualidade ao aumentar o tempo e realizar tarefas de edição. Mas esses benefícios vêm com compensações práticas em comparação com o uso de uma taxa de amostragem mais baixa.
Tamanho do ficheiro
Toda vez que você dobra uma taxa de amostragem, a quantidade de dados gerados também dobra. Uma sessão gravada a 96 kHz ocupará duas vezes mais espaço do que uma sessão de 48 kHz devido à criação de arquivos muito maiores.
Para projetos complexos, isso pode aumentar rapidamente os requisitos de armazenamento e tornar os backups, o compartilhamento e o gerenciamento de arquivos mais desafiadores.
Poder de processamento
Como seria de esperar, uma taxa de amostragem maior exige mais energia da sua CPU. A menos que você tenha uma máquina super animada, você pode descobrir que sua sessão sofre com maior latência, tempos de renderização mais lentos e instabilidade do sistema.
Desempenho do DAW
Embora a maioria das DAWs ofereça suporte a taxas de amostragem mais altas, executar uma sessão a 96 kHz ou mais significa que a DAW precisa trabalhar mais para transmitir áudio. Dependendo do seu sistema e da complexidade da sessão, há um risco maior de desistências ou falhas. Não é ideal quando você está misturando seu próximo banger.
Desempenho do plug-in
Alguns plug-ins fazem uma sobreamostragem interna do sinal de entrada para melhorar a qualidade da saída resultante, por exemplo, plug-ins de medição ou limitadores. Executá-los em uma taxa de amostragem já alta pode prejudicar o desempenho da CPU.
eficiência do fluxo de trabalho
Embora taxas de amostragem mais altas possam oferecer vantagens teóricas e prepará-las para o futuro, executar uma sessão com uma taxa mais alta pode diminuir seu fluxo de trabalho sem nenhuma vantagem perceptível.
- Algumas interfaces de áudio econômicas não conseguem lidar com taxas de amostragem de 96 kHz, o que pode causar distorção no som.
- Você quase sempre precisará reduzir a amostra para criar resultados finais, criando etapas de conversão desnecessárias ao longo do caminho.
- Se seu sistema tiver dificuldade em executar uma sessão com uma taxa de amostragem mais alta, as coisas inevitavelmente levarão mais tempo. A mixagem se tornará entediante e você ainda terá que reduzir a resolução depois.
Podemos ouvir a diferença entre 48 kHz e 96 kHz?

A pergunta de um milhão de dólares nesta discussão é: as pessoas podem realmente ouvir a diferença entre 48 kHz e 96 kHz?
Depende de quem você perguntar.
Alguns ouvintes treinados, principalmente engenheiros de masterização e audiófilos, afirmam ser capazes de ouvir diferenças sutis entre as taxas de amostragem, especialmente se for um instrumento com o qual eles estão altamente sintonizados.
Algumas pessoas afirmam que, mesmo que não consigamos ouvir a diferença entre as duas taxas de amostragem, a existência de conteúdo ultrassônico no som pode ter um impacto na experiência auditiva devido à interação harmônica.
Se isso se deve a diferenças sonoras reais ou apenas a um viés psicológico, está em debate. Mas algumas coisas afetam a forma como ouvimos o som.
Sistemas de reprodução
Lembra da discussão sobre resposta de frequência? Mesmo que você tenha uma audição sobre-humana, muito além da faixa de 20 kHz, se os alto-falantes que você está ouvindo não suportam essas frequências ultrassônicas, a taxa de amostragem mais alta se torna efetivamente inútil.
Limitações da audição humana
A maioria dos adultos experimenta degradação nas faixas superiores da audição à medida que envelhecem. Mesmo que as frequências ultra-altas estejam presentes em um som, há uma boa chance de muitos ouvintes não conseguirem ouvi-las de qualquer maneira.
Considerações práticas
Podemos resumir essa discussão em duas ideias:
- 48 kHz é o padrão da indústria de mídia e preenche todos os requisitos sônicos.
- 96 kHz parece meio legal, mas também vem com muita bagagem.
A escolha da taxa de amostragem certa para seu projeto depende de suas necessidades específicas e do fluxo de trabalho. Aqui está uma análise prática dos diferentes campos da produção de áudio.
Produção musical: gravação, mixagem e masterização
Quando você está trabalhando apenas com música, a escolha da taxa de amostragem se resume a equilibrar a qualidade do áudio com a eficiência do sistema.
- Gravação: alguns engenheiros gostam de rastrear com altas taxas de amostragem de 96 kHz ou mais para capturar todos os detalhes sonoros e evitar erros de aliasing. No entanto, para a maioria das músicas, 48 kHz é mais do que suficiente e sobrecarrega menos os recursos e o armazenamento do sistema. Além disso, ele elimina a necessidade de usar um relógio mestre para manter tudo sincronizado.
- Mixagem e masterização: Atualmente, muitos plug-ins fornecem sobreamostragem interna para fornecer uma saída mais precisa, portanto, trabalhar a 48 kHz ainda fornece um alto padrão de áudio.
- Entrega final: as plataformas de streaming tendem a aceitar arquivos com uma taxa de amostragem de 44,1 ou 48 kHz. Se a música for reproduzida em CD, a mixagem final precisará de conversão de taxa de amostragem de até 44,1 kHz. De qualquer forma, gravar em altas taxas de amostragem é um exagero nessas situações.
Áudio para filmes e programas de TV
Ao trabalhar no cinema e na televisão (incluindo licenciamento de sincronização), 48 kHz é o padrão-ouro. Na maioria dos casos, a resolução de profundidade de bits precisará ser de 16 bits, embora seja uma boa ideia gravar com uma profundidade de 24 bits para começar e reduzir para entrega.
Dada a alta contagem de faixas presentes nas sessões de pós-produção, a gravação a 96 kHz pode apresentar problemas com a eficiência do sistema e o espaço de armazenamento.
Jogos e VR
O áudio em cenários de jogos e realidade virtual geralmente exige taxas de amostragem mais altas devido às demandas exclusivas do formato.
Muitas vezes, é necessário alongar o tempo e mudar o tom dos sons, por isso é melhor gravar a 96 kHz.
Som ao vivo e streaming
Em situações ao vivo, o desempenho em tempo real é a principal prioridade, tornando 48 kHz a melhor escolha.
Recomendações finais
Como regra geral, a maneira mais eficiente e eficaz de gravar áudio é com uma profundidade de 24 bits e uma taxa de amostragem de 48 kHz.
Essas configurações são um ponto ideal entre clareza sonora e eficiência no armazenamento e desempenho da CPU.
Muitos plug-ins já realizam sobreamostragem interna enquanto trabalham nessas taxas, o que significa que os benefícios da gravação a 96 kHz são insignificantes.
Além disso, limitadores e medidores digitais de alta qualidade compensam os picos entre amostras, reduzindo a necessidade de taxas de amostragem mais altas.
Finalmente, 48 kHz é um padrão da indústria para a maioria dos trabalhos profissionais, o que garante uma integração perfeita com colaboradores e distribuidores.
As poucas situações em que pode valer a pena considerar o uso de 96 kHz para gravar são quando:
- um projeto requer extenso alongamento de tempo, mudança de tom ou edição (como síntese granular).
- um projeto é para fins de arquivamento e você deseja preparar o trabalho para o futuro.
Conclusão
Já percorremos muito terreno! Aqui está uma rápida recapitulação do que foi abordado. As notas do penhasco, se você quiser:
- Uma taxa de amostragem de 44,1 kHz é capaz de reproduzir perfeitamente os sinais de áudio até as frequências mais altas dentro da faixa da audição humana.
- A indústria de TV, cinema e mídia usa 48 kHz como padrão.
- A gravação a 96 kHz exige mais capacidade de processamento e mais espaço em disco para armazenar os arquivos maiores resultantes.
- O uso de taxas de amostragem cada vez mais altas resulta em retornos decrescentes em relação à eficiência do sistema e aos custos de armazenamento.
- Se você sabe que usará alongamento de tempo e outras funções de edição em seu áudio, grave a 96 kHz para obter melhores resultados.
Lembre-se de que o contexto em que você está trabalhando é mais importante do que perseguir números.
Se você é um artista, seu público pode não se importar com o fato de você ter produzido uma faixa a 96 kHz. Na verdade, é improvável que eles ouçam a diferença entre isso e algo capturado a 44,1 kHz.
Se você estiver gravando música para cinema e TV, 48 kHz é o equilíbrio perfeito entre qualidade de som e padrões profissionais.
E se você estiver criando uma biblioteca de sons para uma biblioteca de efeitos, 96 kHz é o caminho a seguir para permitir o máximo de recursos de edição.
Em última análise, a decisão é sua. Experimente diferentes taxas de amostragem e veja o que soa bem para você. Se você ouvir uma diferença notável em 96 kHz, vá em frente! (Mas talvez compre um disco rígido maior...).
Não importa o que você acabe usando, vá em frente e faça a música!