もしあなたがDAWの設定を探ってみて、用意されているサンプルレートの配列に愕然としたことがあるとしたら、それはあなただけではありません。主要なDAW(例えばLogic ProやPro Tools)の中には、44.1、48、88.2、96、176.4、192の6つのサンプルレートから選択できるものがあります。
ご存じない方のために説明すると、サンプリング・レートとは、オーディオが録音され、バーチャル・インストゥルメントの場合は生成される解像度のことです。そう考えると、大きい方がいいと思うでしょう?
必ずしもそうではない。
サンプルレートに関する議論のほとんどは、人間の聴力の限界に焦点を当てたものですが、どのサンプルレートで録音するかを選択する際に考慮すべき他の要因もいくつかあります。
そこで私たちの出番です。この記事では、デジタルオーディオの0と1について深く(というか、深く)掘り下げていきます。複雑?そうですね。しかし、この記事が終わる頃には、あなたは48kHzと96kHzの録音の長所と短所を知り、どちらが自分にとってベストかを判断できるようになるでしょう。
サンプルレートを理解する

あなたの家の前を車が走っているとしよう。その車は左から右へ、そして隣家の前を通り過ぎていく。これはアナログの世界では音に相当するもので、波形は連続した音なのだ。
では、その車の動きを再現したいとしよう。左から右へ走る車のフリップブックアニメーションを作ることにする。その車が動いている絵をたくさん作れば作るほど、動きがより細かく滑らかに見える。
これがデジタルオーディオの仕組みだ。アナログ波形を超高速で一連の画像(サンプル)にし、デジタルの世界に再現する。
サンプル・レートとは、1秒間にどれだけの頻度でスナップショットが撮影されるかを示すもので、サンプル・レートが44.1kHzの場合、1秒間に44,100サンプルの波形が撮影されることになる。サンプルレートが高いほど、より多くのスナップショットがキャプチャされることになる。しかし、我々はその余分なディテールを聞くことができますか?
ナイキストの定理

ハリー・ナイキストという賢い若者が、サンプルレートは記録される最高周波数の少なくとも2倍である必要があることを発見した。これはナイキスト周波数、またはナイキスト限界として知られている。
人間が聞き取れる最大周波数は約20kHzなので、すべての可聴周波数を捕捉するには最低40kHzのサンプリングレートが必要である。
この限界以上の周波数を記録しようとすると、エイリアシング(折り返し)が発生する。高い周波数が低い周波数として誤認識され、再構成された信号に歪みやアーチファクトが生じる。
最近のデジタル・アナログ・コンバーターには、アーチファクトを除去するためのアンチエイリアシング・フィルターが搭載されており、基本的に、エイリアスの可能性がある高周波を除去するローパス・フィルターとして機能します。高いサンプルレートでレコーディングすることで、可聴周波数をカットすることなく、これらのフィルターが動作するためのヘッドルームを確保することができます。
簡単に言えば、ナイキストの定理とは、デジタル録音における「どれだけあれば十分か」というルールである。
CDクオリティ・オーディオの出現
44.1kHzというCDの品質基準は、デジタル・オーディオの黎明期に生まれたもので、当時はハードディスク・ドライブがアルバム1枚分の素材を保存するのに適しておらず、ビデオ・レコーダーを再利用していた。
フレームレートと1フレームあたりの使用可能なライン数から、ペンシルヘッドは1フレームあたり3つのオーディオサンプルを保存するために使用し、その結果、サンプルレートは44.1kHzとなった。これはナイキスト理論に適合し、マスターをビデオテープに保存できる最小限のサンプルレートだった。これが、今でいうCDクオリティのオーディオとなった。
フーリエ変換

サンプルレートは、信号がどのようにキャプチャされるかに影響するだけでなく、デジタルオーディオがどのように「読まれるか」にも影響する。
フーリエ変換は、複雑な信号を分析し、異なる周波数の単純な波形に分解するために使用される数学的ツールです。EQ、スペクトログラム、ピッチ検出などのプラグインが、信号全体を分析し、より小さな帯域に分解して機能する仕組みだ。
つまり、オーディオファイルの1秒あたりのスナップショットの情報量が多ければ多いほど(サンプルレートが高ければ高いほど)、フーリエ変換の計算はより正確になります。
周波数特性

サンプル・レートについて議論する際に考慮すべきもう1つの要素は、あなたがレコーディングやモニタリングを行っている機材です。
すべてのオーディオ機器には周波数特性がある:
- 再生可能な周波数
- それがどれほど正確か。
しょぼいラジオシャック・マイクを使ってしょぼいギターのテイクを録音し、しょぼいラジオシャック・スピーカーで再生したら、いい音にはならない可能性が高い。どんなサンプリング・レートを使ってもだ。
テイク・ミー・ハイヤー
このような科学的なことを一通り説明すると、サンプルレートを高くすることで、より高い周波数を捕捉し、より詳細に分析できることがわかる。
しかし、96kHzで録音するということは、48kHzまでの周波数をキャプチャーできるということですが、人間のリスニングの観点からは、44.1kHzの録音と聴感上の違いはありません。卓越した聴力を持つ人でも、高音域は可聴範囲外であることに変わりはない。
また、ナイキスト理論のおかげで、44.1kHzは人間の可聴域内のあらゆる信号を完璧に再生するには十分すぎることがわかっている。
では、なぜ高いサンプルレートを使うのか?
48kHz:業界標準

映画、テレビ、ストリーミングに関しては、48kHzが配信用のサンプル・レートとして広く受け入れられている。より高いサンプル・レートも利用可能ですが、48kHzは、品質、効率、互換性のバランスのおかげで、メディア業界における標準としての地位を確保しています。
なぜ48kHzなのか?
メディア制作の標準として48kHzのサンプルレートを採用した主な理由は、互換性にあった。このサンプルレートは、ヨーロッパとNTSCテレビが使用する異なるフレームベースのビデオシステムとうまく調和し、同時にナイキスト周波数の要件を満たした。
現在では、Netflix、Disney、Amazonのようなストリーミング・プラットフォームは、48kHzでオーディオを配信することを要求していますし、劇場公開用の旧式の実写映画を採譜する場合でも、ミキシング段階で48kHzのステムを配信することを要求されます。
48kHzサンプルレートを使用する利点
48kHzが広く受け入れられるようになったもう一つの理由は、素晴らしいサウンドと処理要求のバランスだ。
アンチエイリアシング
サンプリング周波数がわずかに高いため、アンチ・エイリアシング・フィルターが動作するためのヘッドルームが広くなります。サンプリングレートが44.1kHzの場合、完璧でないアンチエイリアシング・フィルターは、微妙だが測定可能なアーチファクトを引き起こす可能性がある。
一方、サンプリング・レートが48kHzの場合、エイリアシングが発生しても可聴帯域外となる。
リサンプリング
メディア業界で高いサンプルレートが広く使われていることを考えると、48kHzでオーディオを配信することは、リサンプリングの必要性を最小限にします。音楽業界では44.1kHzが一般的ですが、シンクライセンスで作業する場合、完成品は48kHzで納品する必要があります。
低いサンプルレートから48kHzにアップサンプリングする際のサンプルレート変換処理によって、ファイルに不要なアーティファクトが混入する可能性があります。そのため、CDにプリントする場合など、必要であれば常に高音質のサンプルレートで録音し、後でダウンサンプリングすることをお勧めします。
ファイルサイズ
48 kHzでオーディオを録音・処理することで、ファイルサイズを管理しやすくすることができます。これは、ストレージコストやデータ転送時間が重要な要素となる大規模なテレビや映画プロジェクトには不可欠です。
48 kHzのサンプルレートを使用することの限界
48 kHzを使うことには、ほとんど制限がありません。オーディオ界では、48kHzがすべてのプロフェッショナルな用途に本当に「十分」であるかどうかについて議論がありますが、48kHzとそれ以上のサンプルレートの違いは、非常にコントロールされたハイエンドのリスニング環境でしか気づかないことがよくあります。
96 kHz:ハイ・レゾリューション・オーディオ

映画、テレビ、ポッドキャストなどでは48kHzのサンプルレートが業界標準だが、96kHzでの作業を好むエンジニアもいる。理論的な利点としては、高周波数コンテンツをキャプチャするためのヘッドルームの拡大、エイリアシングの低減、処理能力の向上などが挙げられる。
理論的利点
録音範囲の拡大
サンプルレート96kHzでは、48kHzまでの周波数を録音できる。これは人間の可聴域(通常20kHz前後が最高)をはるかに超えているが、この超高域の周波数成分が、人間にはまだ聞こえる微妙な方法で音と相互作用していると主張する人もいる。
エイリアシングの低減
ナイキスト限界を覚えているだろうか?96 kHzで録音すると、この限界が48 kHzまで押し上げられるため、エイリアシング・アーティファクトが可聴音に干渉する可能性が低くなる。
より良いプラグイン処理
サンプルレートが高いと、エフェクトによってはより良い処理ができます。これは特に、オーディオのタイムストレッチやピッチシフトを行うときに顕著です。
高いサンプルレートで録音されたオーディオをタイムストレッチすると、より自然な音質で、よりクリーンなサウンドになります。これが、多くのサウンドデザイナーがさらに高いサンプルレート(192kHz)で作業する理由です。
サチュレーションやディストーションなどの処理も同様です。これらのプラグインは、元のナイキスト限界よりも高い周波数のコンテンツを追加するので、96 kHzのサンプルレートは、ポストエフェクトでエイリアシングが発生する機会を少なくします。
より正確なサンプルピーク測定
96kHzで作業するもう一つの利点は、サンプルピーク測定の精度が向上することです。多くの場合、信号のピークは記録されたサンプルの間に発生します(サンプル間ピークとして知られています)。ミキシング・エンジニアは、1秒あたりのサンプル数が多いほど、信号のピークがどこにあるかをより正確に把握することができます。
将来を見据えたオーディオ品質
96kHzでレコーディングするもう一つの利点は、ゲームに先んじることです。テクノロジーが進化し続けるにつれて、より高いサンプルレートが標準になる可能性があり、将来のハイレゾフォーマットとの互換性を確保するために96kHzを選択するエンジニアもいます。
96 kHzサンプルレートを使用することの欠点
96 kHzで録音することは理論的に多くの利点があり、タイムストレッチや編集作業をするときに、より高品質のオーディオを得ることができます。しかし、これらの利点は、より低いサンプルレートを使う場合と比べて、現実的なトレードオフを伴います。
ファイルサイズ
サンプルレートを2倍にするたびに、生成されるデータ量も2倍になります。96 kHzで録音されたセッションは、48 kHzのセッションよりもはるかに大きなファイルが作成されるため、2倍の容量を必要とします。
複雑なプロジェクトの場合、ストレージ要件が一気に膨れ上がり、バックアップ、共有、ファイル管理がより困難になる可能性がある。
処理能力
ご想像の通り、高いサンプルレートはCPUにより多くのパワーを要求します。よほど高性能なマシンを使っていない限り、セッションのレイテンシが増えたり、レンダリング時間が遅くなったり、システムが不安定になったりするかもしれません。
DAWパフォーマンス
ほとんどの DAW は、より高いサンプルレートをサポートしていますが、96 kHz 以上でセッションを実行することは、 DAW がオーディオをストリーミングするために、よりハードに働かなければならないことを意味します。システムやセッションの複雑さによっては、ドロップアウトやグリッチのリスクが高まります。次の曲をミックスするときには理想的ではありません。
プラグインのパフォーマンス
プラグインの中には、例えばメーター・プラグインやリミッターのように、結果出力の品質を向上させるために、入力信号を内部的にオーバーサンプリングするものがあります。すでに高いサンプルレートでそれらを実行すると、CPUのパフォーマンスが損なわれることがあります。
ワークフローの効率化
高いサンプルレートは理論的な利点と将来性を提供するかもしれませんが、高いレートでセッションを実行すると、顕著な利点がないままワークフローが遅くなる可能性があります。
- 格安のオーディオインターフェースの中には、96kHzのサンプルレートを扱えないものがあり、音に歪みが生じることがある。
- 最終的な成果物を作成するためには、ほとんど常にダウンサンプリングが必要であり、その過程で不必要な変換ステップが発生する。
- もしあなたのシステムが高いサンプルレートでセッションを実行することに苦労しているなら、物事は必然的に長くかかります。ミキシングが面倒になり、その後にダウンサンプリングしなければならなくなります。
48kHzと96kHzの違いは聴き分けられるか?

この議論における100万ドルの疑問は、人々が48kHzと96kHzの違いを実際に聴き分けられるかということだ。
誰に聞くかによるね。
訓練されたリスナー、特にマスタリングエンジニアやオーディオマニアの中には、サンプルレートの微妙な違いを聞き分けることができると主張する人もいる。
たとえ2つのサンプルレートの違いが聞こえなくても、音の中にウルトラソニック・コンテンツが存在すれば、高調波の相互作用によってリスニング体験に影響を与える可能性があると指摘する人もいる。
これが実際の音の違いによるものなのか、それとも単なる心理的バイアスによるものなのかは議論の余地がある。しかし、音の聞こえ方にはいくつかのことが影響している。
再生システム
周波数特性についての議論を思い出してほしい。たとえあなたが20kHzをはるかに超える超人的な聴覚を持っていたとしても、あなたが聴いているスピーカーがこれらの超音波周波数に対応していなければ、高いサンプルレートは事実上無意味になってしまう。
人間の聴力の限界
ほとんどの成人は、加齢とともに聴力の高音域が低下します。音に超高域が含まれていたとしても、多くのリスナーには聞こえない可能性が高い。
実践的な考察
この議論は2つの考えに集約できる:
- 48 kHzはメディア業界の標準であり、すべてのサウンドボックスを満たしている。
- 96kHzはちょっとクールな感じがするが、多くの荷物も伴う。
あなたのプロジェクトに適したサンプルレートの選択は、あなたの特定のニーズとワークフローに依存します。ここでは、オーディオ制作のさまざまな分野での実用的な内訳を示します。
音楽制作レコーディング、ミキシング&マスタリング
音楽だけで作業する場合、サンプルレートの選択は、オーディオ品質とシステム効率のバランスに帰着する。
- レコーディング:音のディテールを余すところなく捉え、エイリアシング・エラーを防ぐために、96kHz以上のハイ・サンプル・レートでトラックすることを好むエンジニアもいる。しかし、ほとんどの音楽では48kHzで十分であり、システム機能やストレージへの負担も少ない。さらに、すべてを同期させるためにマスター・クロックを使う必要もありません。
- ミキシング&マスタリング:最近の多くのプラグインは、より正確な出力を提供するために内部オーバーサンプリング機能を備えている。
- 最終的な納品:ストリーミング・プラットフォームは、44.1kHzか48kHzのサンプルレートのファイルを受け入れる傾向がある。いずれにせよ、このような状況で高いサンプルレートで録音するのはやり過ぎだ。
映画&TVオーディオ
映画やテレビ(シンク・ライセンシングを含む)の場合、48kHzがゴールド・スタンダードです。ほとんどの場合、ビット深度の解像度は16ビットにする必要があるが、最初にビット深度24で録音し、配信用にディザダウンするのは良いアイデアだ。
ポストプロダクションセッションのトラック数が多い場合、96kHzでの録音はシステム効率とストレージスペースに問題が生じる可能性がある。
ゲーム&VR
ゲームやバーチャル・リアリティ・シナリオのオーディオは、そのフォーマット特有の要求から、より高いサンプルレートが求められることが多い。
サウンドの大幅なタイムストレッチや ピッチシフトが必要になることが多いので、96kHzで録音する方が良い。
ライブ・サウンド&ストリーミング
ライブではリアルタイムのパフォーマンスが最優先されるため、48kHzが最適な選択となる。
最終勧告
一般的な経験則として、オーディオを録音する最も効率的で効果的な方法は、ビット深度24、サンプルレート48kHzです。
これらの設定は、音の明瞭さと、ストレージとCPU性能の効率性の間のスイートスポットである。
多くのプラグインは、これらのレートで動作している間、すでに内部でオーバーサンプリングを行っており、96kHzでレコーディングするメリットはごくわずかであることを意味する。
さらに、高品質のデジタル・リミッターとメーターは、サンプル間のピークを補正し、高いサンプル・レートの必要性を低減します。
最後に、48kHzはほとんどのプロフェッショナルな仕事における業界標準であり、協力者や配信業者とのシームレスな統合を保証する。
96kHzでの録音を検討する価値があるのは、以下のような場合である:
- 大規模なタイムストレッチ、ピッチシフト、編集(グラニュラー・シンセシスなど)を必要とするプロジェクト。
- プロジェクトがアーカイブ目的であり、作品を将来にわたって保存しておきたい場合。
結論
我々は多くの分野をカバーしてきた!ここで、これまでの内容を簡単に振り返ってみよう。クリフノート(崖のメモ)とでも言うべきものだ:
- 44.1kHzのサンプルレートは、人間の可聴域内の最高周波数までのオーディオ信号を完璧に再生することができる。
- テレビ、映画、メディア業界は48kHzを標準としている。
- 96kHzで録音するには、より多くの処理能力が必要であり、その結果、より大きなファイルを保存するために、より多くのディスク容量が必要となる。
- 高いサンプルレートを使えば使うほど、システム効率とストレージコストとの関係で、収穫は逓減していく。
- オーディオにタイムストレッチやその他の編集機能を使うことがわかっている場合は、96kHzで録音するとよりよい結果が得られます。
数字を追い求めることよりも、働いている状況の方が重要であることを忘れないでほしい。
あなたがアーティストなら、視聴者はあなたが96kHzでトラックを制作したことを気にしないかもしれません。実際、44.1kHzで録音したものとの違いを聴き取ることはまずないだろう。
映画やテレビ用の音楽を録音する場合、48kHzは音質とプロフェッショナル・スタンダードの完璧なバランスだ。
また、エフェクト・ライブラリー用にサウンド・ライブラリーを構築するのであれば、編集機能を最大限に発揮できる96kHzが適している。
最終的には、あなたが決めることです。さまざまなサンプルレートを試してみて、自分にとって何がいい音かを見てください。もし96kHzで顕著な違いが聴こえるなら、それを選ぶといい!(でも、もっと大きなハードディスク・ドライブを買うべきかも...)。
最終的にどちらを使うにしても、行って音楽を作ってください!