Se vi è capitato di curiosare nelle impostazioni della vostra DAW e di rimanere sbigottiti di fronte all'offerta di frequenze di campionamento, non siete i soli. Alcune delle principali DAW (Logic Pro e Pro Tools, ad esempio) offrono sei frequenze di campionamento tra cui scegliere: 44,1, 48, 88,2, 96, 176,4 e 192.
Nel caso in cui non si abbia familiarità, la frequenza di campionamento è la risoluzione con cui l'audio viene registrato e, nel caso degli strumenti virtuali, prodotto. Per questo motivo, si potrebbe pensare che più grande sia meglio, giusto?
Non necessariamente.
Sebbene la maggior parte delle discussioni sulle frequenze di campionamento sia incentrata sui limiti dell'udito umano, ci sono altri fattori da prendere in considerazione quando si sceglie la frequenza di campionamento con cui registrare.
Ed è qui che entriamo in gioco noi. In questo articolo faremo un'immersione profonda (e intendo profonda) negli zeri e negli uni dell'audio digitale. Complesso? In alcuni punti, sì. Ma alla fine di questo articolo conoscerete i pro e i contro della registrazione a 48kHz rispetto a quella a 96kHz e sarete in grado di decidere quale sia la migliore per voi.
Comprendere le frequenze di campionamento

Immaginate che un'auto passi davanti a casa vostra. Viaggia da sinistra a destra e passa davanti alla casa del vicino in un unico movimento continuo. Questo è l'equivalente del suono nel mondo analogico: la forma d'onda è un suono continuo.
Supponiamo ora di voler replicare il movimento di quell'auto. Decidete di creare un'animazione flip-book del veicolo che viaggia da sinistra a destra. Più immagini si fanno di quell'auto in movimento, più il movimento appare dettagliato e fluido.
È così che funziona l'audio digitale: prende una serie di immagini (o campioni) della forma d'onda analogica a velocità elevatissime, per replicarla nel mondo digitale.
La frequenza di campionamento si riferisce alla frequenza con cui vengono acquisite le istantanee al secondo; una frequenza di campionamento di 44,1 kHz significa che ogni secondo vengono acquisiti 44.100 campioni della forma d'onda in ingresso. Frequenze di campionamento più elevate comportano la cattura di un maggior numero di istantanee. Ma riusciamo a sentire questi dettagli in più?
Teorema di Nyquist

Un giovane intelligente di nome Harry Nyquist scoprì che la frequenza di campionamento deve essere almeno il doppio della frequenza più alta che viene registrata. Questo valore è noto come frequenza di Nyquist o limite di Nyquist.
Poiché gli esseri umani possono udire una frequenza massima di circa 20 kHz, è necessaria una frequenza di campionamento minima di 40 kHz per catturare tutte le frequenze udibili.
Il tentativo di registrare frequenze superiori a questo limite porta all'aliasing, o foldover. Le frequenze più alte vengono rappresentate erroneamente come frequenze più basse, causando distorsioni o artefatti nel segnale ricostruito.
Ogni moderno convertitore digitale-analogico è dotato di filtri anti-aliasing per rimuovere eventuali artefatti, agendo essenzialmente come un filtro passa-basso per eliminare le alte frequenze che potrebbero essere alias. La registrazione a frequenze di campionamento più elevate consente a questi filtri di operare senza tagliare le frequenze udibili.
In parole povere, il teorema di Nyquist è una regola di "quanto è sufficiente" per la registrazione digitale.
L'emergere dell'audio di qualità CD
Lo standard di qualità CD di 44,1 kHz è nato agli albori dell'audio digitale, quando i dischi rigidi non erano all'altezza di memorizzare il materiale di un album e i videoregistratori venivano riutilizzati per questo scopo.
In base alla frequenza dei fotogrammi e alle linee utilizzabili per fotogramma, le teste a matita memorizzavano 3 campioni audio per fotogramma, con una frequenza di campionamento di 44,1 kHz. Si trattava della frequenza di campionamento minima possibile, conforme alla teoria di Nyquist , che consentiva di memorizzare il master su videocassetta. Si trattava di quello che oggi chiamiamo audio di qualità CD.
Trasformata di Fourier

Le frequenze di campionamento non influenzano solo il modo in cui un segnale viene catturato, ma anche il modo in cui l'audio digitale viene "letto".
La trasformata di Fourier è uno strumento matematico utilizzato per analizzare un segnale complesso e scomporlo in forme d'onda semplici a frequenze diverse. È il modo in cui funzionano plugin come gli equalizzatori, gli spettrogrammi e il rilevamento dell'intonazione, analizzando l'intero segnale e scomponendolo in bande più piccole.
Tutto questo per dire che più informazioni ha un file audio in termini di istantanee al secondo (frequenze di campionamento più elevate), più accurati saranno i calcoli della trasformata di Fourier.
Risposta in frequenza

Un altro fattore da considerare quando si parla di frequenze di campionamento è l'apparecchio con cui si registra e si monitora.
Ogni apparecchio audio ha una risposta in frequenza, che può essere vagamente descritta come:
- Quali frequenze può riprodurre e
- quanto accuratamente lo fa.
Se si usa un microfono scadente di Radioshack per eseguire una ripresa con una chitarra scadente e la si riproduce con un paio di diffusori scadenti di Radioshack, è probabile che il suono non sia buono. Non importa quale sia la frequenza di campionamento utilizzata.
Portami più in alto
Dopo aver analizzato tutta questa roba scientifica, possiamo vedere che frequenze di campionamento più elevate ci permettono di catturare frequenze più alte e di analizzarle in modo più dettagliato.
Ma se registrare a 96 kHz significa poter catturare frequenze fino a 48 kHz, dal punto di vista dell'ascolto umano non c'è alcuna differenza udibile rispetto a una registrazione a 44,1 kHz. Anche per le persone con un udito eccezionale, le frequenze più alte saranno comunque al di fuori della gamma udibile.
E grazie alla teoria di Nyquist, sappiamo che 44,1 kHz sono più che sufficienti per riprodurre perfettamente qualsiasi segnale all'interno della gamma uditiva umana.
Allora perché usiamo frequenze di campionamento più elevate?
48kHz: Lo standard industriale

Quando si tratta di film, TV e streaming, 48 kHz è diventata la frequenza di campionamento ampiamente accettata per la consegna. Anche se sono disponibili frequenze di campionamento più elevate, i 48 kHz si sono assicurati un posto come standard nell'industria dei media grazie al loro equilibrio di qualità, efficienza e compatibilità.
Perché i 48 kHz sono la scelta obbligata?
La ragione principale dell'adozione di una frequenza di campionamento di 48 kHz come standard nella produzione di media era la compatibilità. La frequenza di campionamento si adattava bene ai diversi sistemi video basati sui fotogrammi utilizzati dalla televisione europea e NTSC e allo stesso tempo soddisfaceva i requisiti di frequenza di Nyquist.
Al giorno d'oggi, le piattaforme di streaming come Netflix, Disney e Amazon richiedono che l'audio sia consegnato a 48 kHz, e anche se state registrando un vero e proprio film della vecchia scuola per l'uscita nelle sale cinematografiche, vi sarà richiesto di consegnare degli stem a 48 kHz per la fase di missaggio.
Vantaggi dell'uso di una frequenza di campionamento di 48 kHz
Un altro motivo per cui i 48 kHz sono diventati una frequenza di campionamento ampiamente accettata è il loro equilibrio tra un suono eccellente e le esigenze di elaborazione.
Anti-Aliasing
La frequenza di campionamento leggermente più alta consente ai filtri anti aliasing di operare con un margine maggiore. A frequenze di campionamento di 44,1 kHz, un filtro anti aliasing non perfetto può introdurre artefatti sottili ma misurabili.
D'altra parte, quando si utilizzano frequenze di campionamento di 48 kHz, qualsiasi aliasing si verifichi sarà al di fuori dello spettro udibile.
Ricampionamento
Data la diffusione della frequenza di campionamento più alta nel settore dei media, la consegna dell'audio a 48 kHz riduce al minimo la necessità di ricampionare. Mentre i 44,1 kHz sono una pratica comune nell'industria musicale, se si lavora con licenze di sincronizzazione il prodotto finito dovrà essere consegnato a 48 kHz.
Il processo di conversione della frequenza di campionamento quando si passa da frequenze di campionamento inferiori a 48 kHz può portare all'introduzione di artefatti indesiderati nel file. Pertanto, è sempre una buona idea registrare con una frequenza di campionamento di qualità superiore e, se necessario, effettuare il downsampling in un secondo momento, ad esempio per la stampa su CD.
Dimensione del file
La registrazione e l'elaborazione dell'audio a 48 kHz mantiene le dimensioni dei file gestibili, il che è essenziale per i grandi progetti televisivi e cinematografici, dove i costi di archiviazione e i tempi di trasferimento dei dati sono un fattore importante.
Limitazioni dell'uso di una frequenza di campionamento di 48 kHz
Le limitazioni dell'uso dei 48 kHz sono davvero poche. Sebbene ci sia un certo dibattito all'interno della comunità audio sul fatto che sia davvero "abbastanza buono" per tutte le applicazioni professionali, la differenza tra 48 kHz e una frequenza di campionamento superiore è spesso percepibile solo in ambienti di ascolto molto controllati e di alto livello.
96 kHz: Audio ad alta risoluzione

Sebbene la frequenza di campionamento di 48 kHz sia lo standard industriale per film, TV, podcast e simili, alcuni ingegneri preferiscono lavorare a 96 kHz. I vantaggi teorici sono: maggiore spazio per l'acquisizione di contenuti ad alta frequenza, riduzione dell'aliasing e migliori capacità di elaborazione.
Vantaggi teorici
Gamma di registrazione estesa
Una frequenza di campionamento di 96 kHz consente di registrare frequenze fino a 48 kHz. Sebbene questa frequenza sia ben al di là della gamma dell'udito umano (che in genere raggiunge il massimo intorno ai 20 kHz), alcuni sostengono che questo contenuto di frequenze ultra-elevate interagisca con il suono in modi sottili che l'uomo può comunque percepire.
Aliasing ridotto
Ricordate il limite di Nyquist? La registrazione a 96 kHz spinge questo limite fino a 48 kHz, riducendo così le possibilità che gli artefatti di aliasing interferiscano con il suono udibile.
Migliore elaborazione dei plugin
Le frequenze di campionamento elevate possono anche migliorare l'elaborazione di alcuni effetti. Ciò è particolarmente evidente quando si esegue il time-stretching dell'audio o il pitch-shifting.
Il time-stretching dell'audio registrato a frequenze di campionamento più elevate produce un suono più pulito, con una qualità più naturale. Per questo motivo molti sound designer lavorano a una frequenza di campionamento ancora più alta (192kHz).
Lo stesso vale per le elaborazioni come la saturazione e la distorsione. Questi plugin aggiungono ulteriore contenuto ad alta frequenza al di sopra del limite Nyquist originale, quindi una frequenza di campionamento di 96 kHz ridurrà le possibilità di aliasing dopo l'effetto.
Misura del picco del campione più accurata
Un altro vantaggio di lavorare a 96 kHz è la maggiore precisione nella misurazione dei picchi dei campioni. Spesso il picco di un segnale si verifica tra i campioni che sono stati registrati, i cosiddetti picchi intercampione. Con una frequenza di campionamento più alta, che contiene un maggior numero di campioni al secondo, il tecnico di mixaggio otterrà una rappresentazione più accurata della posizione dei picchi del segnale.
Qualità audio a prova di futuro
Un altro vantaggio percepito della registrazione a 96 kHz è quello di rimanere al passo con i tempi. Con la continua evoluzione della tecnologia, frequenze di campionamento più elevate potrebbero diventare la norma e alcuni tecnici scelgono i 96 kHz per garantire la compatibilità con i futuri formati ad alta risoluzione.
Gli svantaggi dell'uso di una frequenza di campionamento di 96 kHz
La registrazione a 96 kHz presenta molti vantaggi teorici e può garantire una migliore qualità audio durante il time-stretching e l'esecuzione di operazioni di editing. Tuttavia, questi vantaggi comportano dei compromessi pratici rispetto all'utilizzo di una frequenza di campionamento inferiore.
Dimensione del file
Ogni volta che si raddoppia la frequenza di campionamento, raddoppia anche la quantità di dati generati. Una sessione registrata a 96 kHz occuperà il doppio dello spazio rispetto a una sessione a 48 kHz, a causa dei file molto più grandi creati.
Per i progetti complessi, questo può far lievitare rapidamente i requisiti di archiviazione e rendere più impegnativi i backup, la condivisione e la gestione dei file.
Potenza di elaborazione
Come ci si aspetterebbe, una frequenza di campionamento più elevata richiede più energia dalla CPU. A meno che non si disponga di una macchina superaccessoriata, è possibile che la sessione soffra di una maggiore latenza, di tempi di rendering più lenti e di instabilità del sistema.
Prestazioni DAW
Sebbene la maggior parte delle DAW supporti frequenze di campionamento più elevate, l'esecuzione di una sessione a 96 kHz o più significa che la DAW deve lavorare di più per trasmettere l'audio. A seconda del sistema e della complessità della sessione, aumenta il rischio di perdite di segnale o di glitch. Non è l'ideale quando si sta mixando il prossimo brano.
Prestazioni del plugin
Alcuni plugin sovracampionano internamente il segnale in ingresso per migliorare la qualità dell'output risultante, ad esempio i plugin di misurazione o i limitatori. L'esecuzione a una frequenza di campionamento già elevata può compromettere le prestazioni della CPU.
Efficienza del flusso di lavoro
Sebbene le frequenze di campionamento più elevate possano offrire vantaggi teorici e future, l'esecuzione di una sessione a una frequenza più elevata potrebbe rallentare il flusso di lavoro senza alcun vantaggio apprezzabile.
- Alcune interfacce audio economiche non sono in grado di gestire frequenze di campionamento di 96 kHz, il che può causare distorsioni nel suono.
- Dovrete quasi sempre effettuare un downsample per creare i prodotti finali, creando inutili passaggi di conversione lungo il percorso.
- Se il vostro sistema fa fatica a gestire una sessione a una frequenza di campionamento più alta, le cose si allungheranno inevitabilmente. Il missaggio diventerà noioso e dovrete comunque effettuare il downsample in seguito.
Si può sentire la differenza tra 48 kHz e 96 kHz?

La domanda da un milione di dollari in questa discussione è: le persone possono effettivamente sentire la differenza tra 48 kHz e 96 kHz?
Dipende da chi lo chiede.
Alcuni ascoltatori esperti, in particolare ingegneri di masterizzazione e audiofili, affermano di essere in grado di percepire sottili differenze tra le frequenze di campionamento, in particolare se si tratta di uno strumento con cui hanno una grande sintonia.
Alcuni sostengono che, anche se non si sente la differenza tra le due frequenze di campionamento, l'esistenza di contenuti ultrasonici all'interno del suono potrebbe avere un impatto sull'esperienza di ascolto a causa dell'interazione armonica.
Se ciò sia dovuto a differenze sonore effettive o solo a un pregiudizio psicologico è oggetto di dibattito. Ma un paio di cose influenzano il modo in cui percepiamo il suono.
Sistemi di riproduzione
Ricordate la discussione sulla risposta in frequenza? Anche se avete un udito super umano, ben oltre la gamma dei 20 kHz, se i diffusori su cui state ascoltando non supportano queste frequenze ultrasoniche, la frequenza di campionamento più elevata viene resa di fatto inutile.
Limitazioni dell'udito umano
La maggior parte degli adulti, con l'avanzare dell'età, subisce un deterioramento delle gamme superiori dell'udito. Anche se le frequenze ultra-alte sono presenti in un suono, è molto probabile che molti ascoltatori non siano comunque in grado di sentirle.
Considerazioni pratiche
Possiamo ridurre questa discussione a due idee:
- 48 kHz è lo standard dell'industria dei media e soddisfa tutte le esigenze sonore.
- I 96 kHz sembrano piuttosto interessanti, ma hanno anche un sacco di bagagli.
La scelta della frequenza di campionamento giusta per il progetto dipende dalle esigenze specifiche e dal flusso di lavoro. Ecco una ripartizione pratica per i diversi settori della produzione audio.
Produzione musicale: Registrazione, missaggio e masterizzazione
Quando si lavora solo sulla musica, la scelta della frequenza di campionamento si riduce al bilanciamento tra qualità audio ed efficienza del sistema.
- Registrazione: alcuni tecnici amano registrare ad alte frequenze di campionamento, 96 kHz o superiori, per catturare ogni dettaglio sonoro e per evitare errori di aliasing. Per la maggior parte della musica, tuttavia, i 48 kHz sono più che sufficienti e mettono meno a dura prova le capacità del sistema e lo spazio di archiviazione. Inoltre, non è necessario utilizzare un master clock per mantenere tutto sincronizzato.
- Mixaggio e masterizzazione: molti plugin oggi offrono un sovracampionamento interno per fornire un'uscita più accurata, quindi lavorare a 48 kHz fornisce ancora un audio di alto livello.
- Consegna finale: le piattaforme di streaming tendono ad accettare file con una frequenza di campionamento di 44,1 o 48 kHz. Se la musica verrà riprodotta su CD, il mix finale dovrà essere convertito in frequenza di campionamento a 44,1 kHz. In ogni caso, la registrazione con frequenze di campionamento elevate è eccessiva in queste situazioni.
Audio per film e TV
Quando si lavora in ambito cinematografico e televisivo (comprese le licenze di sincronizzazione ), i 48 kHz sono il gold standard. Nella maggior parte dei casi, la risoluzione della profondità di bit dovrà essere di 16 bit, anche se è una buona idea registrare con una profondità di bit di 24 per iniziare e ridurre il dither per la consegna.
Dato l'elevato numero di tracce presenti nelle sessioni di post-produzione, la registrazione a 96 kHz potrebbe presentare problemi di efficienza del sistema e di spazio di archiviazione.
Giochi e VR
L'audio negli scenari di gioco e di realtà virtuale richiede spesso frequenze di campionamento più elevate a causa delle esigenze uniche del formato.
Spesso è necessario un esteso time-stretching e pitch shifting dei suoni, quindi è meglio registrare a 96 kHz.
Suono e streaming dal vivo
Nelle situazioni dal vivo, le prestazioni in tempo reale sono la priorità assoluta, rendendo i 48 kHz la scelta migliore.
Raccomandazioni finali
Come regola generale, il modo più efficiente ed efficace per registrare l'audio è una profondità di bit di 24 e una frequenza di campionamento di 48 kHz.
Queste impostazioni rappresentano un punto di equilibrio tra chiarezza sonora ed efficienza in termini di prestazioni di memoria e CPU.
Molti plugin eseguono già un sovracampionamento interno mentre lavorano a queste velocità, il che significa che i vantaggi della registrazione a 96 kHz sono trascurabili.
Inoltre, i limitatori e i meter digitali di alta qualità compensano i picchi inter-campione, riducendo la necessità di frequenze di campionamento più elevate.
Infine, 48 kHz è uno standard industriale per la maggior parte dei lavori professionali, che garantisce una perfetta integrazione con collaboratori e distributori.
Le poche situazioni in cui può valere la pena di prendere in considerazione l'uso di 96 kHz per registrare sono quando:
- un progetto richiede un esteso time-stretching, pitch shifting o editing (come la sintesi granulare).
- un progetto è a scopo di archiviazione e si desidera proteggere il lavoro in futuro.
Conclusione
Abbiamo coperto un sacco di terreno! Ecco un breve riassunto di ciò che è stato trattato. Le note essenziali, se volete:
- Una frequenza di campionamento di 44,1 kHz è in grado di riprodurre perfettamente i segnali audio fino alle frequenze più alte della gamma dell'udito umano.
- L'industria televisiva, cinematografica e dei media utilizza 48 kHz come standard.
- La registrazione a 96 kHz richiede una maggiore potenza di elaborazione e più spazio su disco per memorizzare i file più grandi che ne risultano.
- L'utilizzo di frequenze di campionamento sempre più elevate comporta rendimenti decrescenti in relazione all'efficienza del sistema e ai costi di archiviazione.
- Se sapete che userete il time-stretching e altre funzioni di editing sull'audio, registrate a 96 kHz per ottenere risultati migliori.
Ricordate che il contesto in cui lavorate è più importante della ricerca dei numeri.
Se siete un artista, al vostro pubblico potrebbe non interessare che abbiate prodotto una traccia a 96 kHz. In effetti, è improbabile che senta la differenza rispetto a una traccia catturata a 44,1 kHz.
Se state registrando musica per il cinema e la TV, i 48 kHz rappresentano il perfetto equilibrio tra qualità del suono e standard professionali.
E se state costruendo una libreria di suoni per una libreria di effetti, 96 kHz è la strada da seguire per consentire la massima capacità di editing.
In definitiva, la decisione spetta a voi. Sperimentate con diverse frequenze di campionamento e vedete cosa vi suona bene. Se sentite una differenza notevole a 96 kHz, fatelo! (Ma magari comprate un disco rigido più grande...).
Qualunque sia la scelta che farete, andate avanti e fate musica!