O que é o Dithering: O Guia Supremo para Principiantes

O que é o Dithering: O Guia Supremo para Principiantes O que é o Dithering: O Guia Supremo para Principiantes

Quando entrar pela primeira vez na produção áudio, encontrará várias palavras e frases estrangeiras que passarão pelo seu radar ou o deixarão intrigado; profundidade de bits, atenuação, sidechaining, etc. (o léxico é aparentemente interminável). Talvez um dos exemplos mais comuns disto seja o termo "dithering". Quer já tenha ou não visto esta palavra antes, o seu significado não é abundantemente claro. E no entanto, o dithering é uma das ferramentas mais essenciais e úteis no arsenal de mistura e domínio, por isso é uma boa ideia familiarizar-se com ele. Então, o que é o dithering, exactamente? Quando e porquê o dízimo é utilizado? E quais são os diferentes tipos de dízimos para o áudio?

Vamos responder a todas estas questões e mais neste artigo, e tentar tornar o conceito de dithering tão digerível quanto possível.

O que é o Dithering?

Há muita profundidade para ditar, por isso vamos começar com uma definição simples. A dízima é ruído . Para ir um pouco mais longe, o dithering é uma forma particular de distorção.

Mais especificamente, o dithering é um processo em que uma pequena quantidade de ruído (ou seja, ruído branco) é combinada com um sinal de áudio (ou imagem/vídeo) existente para ajudar a manter a sua qualidade global ao baixar a sua resolução.

Veja este vídeo por Rowntree Audio abaixo para uma demonstração rápida e fácil de dither:

[VIDEO EMBED] https://www.youtube.com/watch?v=cLnuoQ6pIKk

À primeira vista, isto pode parecer desnecessário e até contraintuitivo. Afinal de contas, se o seu objectivo é colocar a música de maior qualidade lá fora, por que razão quereria adicionar ou reduzir o ruído em primeiro lugar? E como é que adicionar ruído a um sinal o ajuda a soar melhor ou mais dinâmico?

Para compreender as respostas a estas perguntas, é necessário primeiro ter uma noção de como funciona o áudio digital.

O que a Dithering tem a ver com o Digital Audio

O áudio pode ser dividido em duas categorias básicas: analógico e digital. Enquanto o áudio analógico é um fluxo contínuo de ondas sonoras, o áudio digital é uma representação em bloco, baseada em números, do "verdadeiro negócio". Assim, sempre que grava algo na sua estação de trabalho de áudio digital (DAW) , o software "amostra" o áudio introduzido e cria uma cópia digital através da conversão analógico-digital (ADC).

Desde que esteja a gravar com ferramentas digitais modernas à "taxa de amostragem" adequada (geralmente 44,1 kHz) e "profundidade de bits" (geralmente 24-bit ou 32-bit float), esta versão digital deve soar virtualmente idêntica à entrada analógica. A taxa de amostragem é uma medida de quantas amostras por segundo são extraídas do sinal analógico para criar a versão digital, e a profundidade de bits refere-se à resolução de áudio digital, ou seja, a quantidade de informação embalada em cada amostra.

Sinais de corte até ao tamanho

Agora, se todos tivéssemos um poder de processamento ilimitado à nossa disposição, poderíamos teoricamente gravar, exportar e ouvir um ficheiro áudio digital com resoluções infinitamente altas. É claro que não é este o caso. Em vez disso, temos de fazer algumas concessões para obter uma gravação do ponto A ao ponto B. É uma questão do que é manejável - enquanto que se vai gravar a uma profundidade de 24-bit ou 32-bit (ou superior) na maioria dos DAWs, a maioria dos dispositivos e formatos de reprodução de áudio só funcionam com uma resolução de 16-bit (Spotify e Apple Music, por exemplo, transmitir áudio de 16-bit a uma taxa de amostragem de 44,1 kHz).

Se quiser que a sua música seja tão acessível quanto possível, deve reduzir as suas gravações de alta qualidade para se adaptar a estes vários formatos. Assim, deve reduzir os seus ficheiros áudio (ou seja, baixá-los para uma profundidade de bits inferior) ao exportá-los. Ao mesmo tempo, não quer eliminar as nuances e dinâmicas do seu áudio durante a redução da profundidade de bits.

É aqui que entra em jogo o poder da dither.

Ditadura: Clarificação de um conceito distorcido

Sem aplicar dither, o que aconteceria quando se convertesse o áudio digital de uma resolução mais alta para uma mais baixa? Como pode imaginar, aqueles números em bloco (os que representam o sinal de entrada) que mencionámos anteriormente tornar-se-iam esmagados e ainda mais em bloco, transformando aquilo que costumava assemelhar-se a uma onda algo contínua em algo mais como uma escadaria. Este processo chama-se truncagem e resulta no que é conhecido como erro de quantização, distorção de quantização, ou ruído de quantização.

Se estiver familiarizado com formas de onda e como diferentes configurações soam com base na aparência, sabe que esta forma de passo parece distorcida. Mais especificamente, o áudio com amostra reduzida que não é díspar produz harmónicos que estão correlacionados com o sinal áudio original e cortam através do ouvido humano bastante alto (distorção harmónica).

A última coisa que deseja é que a distorção não intencional e ruidosa corra por todo o seu áudio intacto, claro. Quando se adiciona ruído de baixo nível ao áudio antes do processo de quantização, esta distorção harmónica é essencialmente codificada e perde significativamente a sua presença.

Em última análise, o dithering permite que a sua mistura mantenha o seu alcance dinâmico e som global original ao ser acoplada a uma resolução inferior.

O dízimo depende da variação aleatória

Se o conceito de dithering ainda não estiver cristalino, lembre-se que se trata de aleatoriedade. O ruído que o dithering acrescenta ao seu áudio é aleatório e não correlacionado (pense em "assobiar" o som emitido pelo ruído branco). Como resultado, aquelas distorções correlacionadas que ocorrem ao reduzir a profundidade de bits do seu áudio não são permitidas a passar por cima.

Este conceito de adicionar ruído aleatório a algo também ocorre durante o processamento da imagem. Imagine olhar para uma imagem nítida numa televisão HD. Depois, imagine ver a mesma imagem num televisor mais antigo com uma resolução muito mais baixa. Perder-se-iam muitos dados neste processo, criando uma imagem pixelizada com bandas coloridas (o que ocorre quando a informação de cor não é representada com precisão).

Esta transferência de alta definição para baixa definição poderia ser suavizada através de dithering. Em vez de se empurrar directamente a imagem para um espaço mais pequeno, a informação da imagem é primeiro embaralhada, reduzindo a quantidade de profundidade de cor. No final, a imagem desprovida de amostra mantém a sua forma relativa, cor e estrutura.

A imagem abaixo dar-lhe-á uma melhor compreensão de como funciona o dithering em imagens.

À esquerda, verá a imagem original com todas as suas curvas e gradientes suaves. A imagem do meio mostra o que acontece quando a fonte é truncada numa resolução menor sem adição de dither -- pode ver uma pixelização significativa e uma banda de cor. Finalmente, a imagem da direita representa a imagem com a mesma resolução que a versão do meio, mas com o ruído adicionado antes da amostragem decrescente. Embora ainda apresentada com uma resolução inferior, esta imagem final representa melhor a sua fonte original, tanto em termos de forma como de cor.

Quando usar o Dithering

Então, quando é que se deve adicionar o áudio? Como regra de base, o dithering deve sempre ocorrer sempre que se reduz a amostra de áudio (frequentemente na fase de masterização ou exportação). Por outras palavras, use o dithering sempre que a distorção de quantização aparecer no seu áudio (o que acontecerá quando mudar a profundidade do bit de mais alto para mais baixo).

Como regra geral, exportar e dominar o áudio quase sempre exige hesitação , quer o seu DAW o faça por si automaticamente ou o trate manualmente. Na maioria dos casos, a masterização envolve esmagar um ficheiro de áudio de 32 bits ou 24 bits numa profundidade de 16 bits, pelo que a adição de dither é necessária aqui.

A dithering deve quase sempre ser executada durante o salto ou exportação, ou utilizada como efeito final na cadeia de um sinal (alguns limitadores apresentam uma função de dithering própria).

Quando não usar o Dithering

Só porque o dithering é prática corrente na produção áudio digital não significa, no entanto, que seja sempre necessário. Se estiver a preparar uma faixa para masterização através de um engenheiro de masterização ou eMastered, por exemplo, deve evitar ditar o seu áudio, uma vez que este será tratado por si (como mencionado acima, a dither é normalmente utilizada durante o processo de masterização).

Também poderá não precisar de se contentar se estiver a exportar áudio com uma resolução elevada (ou seja, 32 bits). E aguarde o dithering quando converter áudio para formatos como AAC ou .mp3 , pois estes processos irão comprimir o som por si próprios.

Por vezes é possível escapar à hesitação, mesmo quando não é necessária. Em alguns casos, o ruído acrescentado não será suficientemente audível para mudar muito de nada no seu áudio. Na pior das hipóteses, porém, a sua faixa pode acabar com um assobio perceptível que ninguém quer ouvir. Por segurança, então, siga a regra acima mencionada: use o dithering apenas para esconder a distorção de quantização (isto é, quando exportar áudio de uma profundidade de bits mais alta para uma mais baixa).

Diferentes Tipos de Dithering

Como se o conceito de dithering sozinho não fosse suficientemente difícil de apreender, há múltiplos tipos de dither à sua disposição. Para o melhor ou para o pior, não há grandes diferenças entre estes tipos de dither - nenhuma que seja perceptível para o ouvido médio, de qualquer forma. Ainda assim, cada tipo de dither adiciona um tipo diferente de ruído de baixo nível ao áudio, dependendo da sua gama dinâmica actual. Alguns tipos de dither apresentam mesmo a formação de ruído, em que frequências específicas são atenuadas ou impulsionadas por uma curva de equalização (EQ).

Diferentes DAWs e plugins oferecem diferentes variações de dither. No Logic Pro X, por exemplo, pode empregar três tipos principais de dither ao saltar: POW-r #1, POW-r #2, e POW-r #3. A definição de dither correcta para os seus fins dependerá principalmente da gama dinâmica do seu áudio.

Dithering POW-r #1

Esta primeira categoria de dither oferecida pela Logic Pro não oferece modelação sonora e é melhor utilizada em misturas com gamas dinâmicas baixas.

POW-r #2 Dithering

Utilizado principalmente para a fala (ou seja, podcast ou emissões de rádio), o dithering POW-r #2 (noise shaping) reduz o ruído na gama de frequências de 2kHz e aumenta-o em cerca de 14kHz e mais, tudo isto enquanto esconde a distorção da quantização. Esta equalização suave funciona bem para clarificar muitos tipos vocais.

POW-r #3 Dithering

Quanto à terceira opção de dithering do Logic Pro, a dithering POW-r #3 (noise shaping) funciona melhor para misturas altamente dinâmicas, tais como música acústica, orquestral, ou de grandes bandas. A modulação/equalização do ruído utilizada por este tipo de dithering vai além da POW-r #2, o que faz sentido para gravações mais dinâmicas.

Outros tipos de Dithering

Ao explorar outros DAWs e plugins limitadores/ruído, poderá deparar-se com termos como "nenhum," "moderado," e "ultra". Estas palavras referem-se à quantidade de dither aplicada a um determinado sinal. De um modo geral, a formação de ruído oferecida pelos diferentes tipos de dither fixa-se no conteúdo de frequência mais baixa do sinal (área de 2kHz) e amplifica as suas frequências mais altas.

Dithering FAQs

Devo usar dither?

Se estiver a reduzir o seu áudio de uma maior profundidade de bits para uma menor (ou seja, ponto fixo de 32 bits para 24 ou 16 bits), deve empregar dither.

Quando deve fazer áudio?

Use sempre dither ao exportar, saltar, ou dominar o seu áudio. Por outras palavras, use dither ao baixar a profundidade do bit da sua faixa.

Devo usar o dithering ao dominar?

Sim. De facto, o processo de masterização é muitas vezes o melhor momento para usar o dithering, uma vez que esconde qualquer distorção de quantização indesejada antes de baixar a profundidade do bit de áudio. Desta forma, a sua faixa estará pronta para ser reproduzida numa variedade de plataformas e dispositivos.

Consegues ouvir dither?

R: Se ouvir correctamente o seu áudio, não ouvirá de todo o ruído de baixo nível, especialmente em contexto. É claro que é possível ouvir dither se o aplicar a um ficheiro áudio silencioso e aumentar significativamente o volume. A dither soará como alguma variação do ruído branco (um som suave, consistente e sibilante).

Consegue ouvir uma diferença entre áudio de 16 bits e áudio de 24 bits?

R: A menos que tenha um ouvido bem treinado ou esteja a ouvir uma peça de música altamente dinâmica em altifalantes de alta qualidade, provavelmente não notará qualquer diferença entre áudio de 24-bit e 16-bit.

Que ruído é útil para o dithering?

O ruído branco, castanho e cor-de-rosa podem ser todos úteis para o dithering. Todas estas são variações do som "sibilante" que se pode reconhecer ao sintonizar um rádio. O ruído branco está espalhado pelo espectro de frequências, o ruído castanho está na parte inferior, e o ruído rosa cai algures no meio.

É preferível o ruído azul?

O dithering do ruído azul é benéfico para manter a fidelidade de uma imagem ao baixar a sua resolução a taxas de amostragem significativamente baixas. Os procedimentos do IEEE têm aqui um estudo exaustivo sobre este fenómeno.

O dithering faz diferença?

Sim, especialmente se a sua canção apresentar uma gama altamente dinâmica. Ditar correctamente o seu áudio ao reduzir a sua profundidade de bits reduzirá a distorção de quantização enquanto mantém ou melhora a sua dinâmica.

Devo optar pelo Soundcloud?

Porque o Soundcloud toca faixas a 16-bits (e 48 kHz), é normalmente sensato abandonar a sua faixa antes de a carregar para lá. Note-se que Soundcloud optimiza todo o áudio para streaming e também oferece uma ferramenta de masterização algorítmica aos utilizadores. Pode ler mais sobre as recomendações de carregamento do Soundcloud aqui .

O resultado final sobre o Dithering

O ditar é um desses conceitos/ferramentas que parece mais complicado do que realmente é. Em última análise, o dither é algum tipo de ruído de baixo nível que pode adicionar ao seu áudio para reduzir a distorção de quantização ao baixar a sua profundidade de bits. Antes de submeter a sua faixa ao eMastered para masterização, sugerimos que exporte o seu áudio no formato mais elevado possível, tanto em termos de profundidade de bit como de taxa de amostragem (ou seja, 32-bit, 48 kHz). A partir daí, aplicaremos o dithering ao seu áudio, conforme necessário.

Dê vida às suas canções com um domínio profissional de qualidade, em segundos!