プロシージャル・オーディオ完全初心者ガイド

プロシージャル・オーディオ完全初心者ガイド プロシージャル・オーディオ完全初心者ガイド

ゲームに没頭していると、足音や爆発音、環境音など、様々なサウンドが聞こえてきます。これらの音のほとんどは、才能あるサウンドデザイナーによって事前に録音されたオーディオサンプルです。

このようなオーディオの小さな断片は、1発の銃声のようなワンショットや、宇宙船のエンジンの絶え間ない音のようなループなど、様々な形で提供されています。しかし、ビデオゲームのすべてのサウンドが、事前に録音されたサンプルから作られているわけではないことは、ご存じないかもしれません。中には、ゲームをプレイしながらその場で作られるサウンドもあります。

これは私たちがプロシージャルオーディオと呼んでいるもので、ゲームの個人的な小さな作曲家だと考えています。これを使えば、プリレンダリングされたオーディオファイルに頼ることなく、ゲームプレイ中に動的にサウンドを作成することができます。つまり、キャラクターが砂利を踏んだ時に聞こえる音は、毎回微妙に異なる可能性があり、ゲームをより没入感のあるリアルなものにします。

このガイドでは、プロシージャルオーディオの歴史や仕組み、最新のゲームでの使用例など、プロシージャルオーディオに関するあらゆる情報を紹介します。

サウンドデザイナーを目指す人も、好きなゲームの技術に興味がある人も、ぜひお立ち寄りください!私たちはたくさんのことをカバーしています。

プロシージャル・オーディオとは?

プロシージャルオーディオは、ゲームサウンドデザインの魅力的な側面です。このアイデアは、事前に録音して再生するのではなく、ゲームをプレイしながら、実行時にサウンドを作成したり、その場で生成したりすることです。

平たく言えば、プロシージャルサウンドデザインは、あらかじめ決められた動作に基づいてサウンドエフェクトを作成します。例えば、キャラクタが様々な路面を歩くたびに、事前に録音したサンプルなしで足音サウンドを生成する方法を知っているシステムのようなものです。その代わり、リアルタイムでサウンドを合成し、それぞれの足音がわずかにユニークになります。

このテクニックは、環境アートやレベルデザインなど、ゲームの他の部分で使われるプロシージャル生成に似ています。ゲームが、プレイするたびに新しい森やダンジョンのレイアウトを作り出すように、プロシージャルオーディオも、ゲームの現在の状態やあなたのインタラクションに基づいてサウンドスケープを作り出します。

プロシージャルオーディオを使うことで、サウンドデザイナーは深く統合されたサウンドスケープを作ることができ、プレイヤーのアクションやゲーム環境に、まとまりのある信じられる方法で反応します。

しかし、一般的なプロシージャルサウンドデザインのテクニックを使うことにはトレードオフがあります。

大きな課題の1つは、サウンドが高品質でリアルであることを保証する複雑さです。説得力のあるプロシージャルオーディオを作成することは、録音済みのサンプルを使用するよりも技術的に難しい場合があります。加えて、より多くのCPUを必要とするため、特にローエンドシステムでは、ゲームのパフォーマンスに影響を与える可能性があります。

プロシージャルサウンドデザインの歴史

ゲームの黎明期には、プロシージャルなサウンドデザインは単なるアートフォームではありませんでした。サウンドの必需品だったのです。初期のゲームシステムの限られたRAMでは、プロシージャルオーディオの代替となる、録音済みのオーディオサンプルのストレージ要求を処理できませんでした。この制約により、開発者はゲームのプレイに合わせてリアルタイムでサウンドを生成する必要に迫られたのです。

ゲーム内オーディオは、1972年にマグナボックス・オデッセイで発売された代表的なゲーム『Pong』から始まった。興味深いことに、オリジナルのマグナボックス・オデッセイにはサウンドがまったく搭載されていなかった。サウンドを組み込んで歴史に名を刻んだのは、アタリ版の『Pong』だった。アタリは、ビデオ出力とオーディオ出力の両方を扱うように設計されたハードウェアの一部であるTIA(Television Interface Adapter)を使用することでこれを実現した。

TIAは2つのオシレータを使って音波を発生させることができました。これらのオシレータを操作することで、Atari版『Pong』はシンプルかつ効果的なオーディオを作成することができ、ゲームにおけるプロシージャルサウンドデザインの最初の事例となりました。

このゲームでは、3つの主要なサウンドがあり、それぞれがプロシージャルに生成される:

  • 最初の音は、ボールがパドルに当たったときに鳴るビープ音で、プレーヤーは自分のヒットを即座に音声で確認することができる。
  • 2つ目の音は、ボールが壁に衝突したときのポンという深い音で、パドルヒットと区別できる。
  • 3つ目の音は、得点が入ったことを示す高めの音だった。

現在の基準からすれば基本的なものですが、これらのサウンドは、ゲームの没入感を高めるために不可欠な、新たな関与とフィードバックのレイヤーを追加しました。

もちろん、技術が進化するにつれて、プロシージャル・オーディオの複雑さや質も向上していった。

プロシージャル・オーディオの進化

1970年代後半、プロシージャルオーディオは様々なゲーム機で形を取り始めた。この時代の3つの顕著なシステムは、Atari 2600、Fairchild Channel F、Bally Astrocadeでした。これらのゲーム機はそれぞれ、ハードウェアの制約の中でゲーム体験を向上させるためにプロシージャルオーディオを利用しました。

1980年代の進歩は、ゲームオーディオの限界をさらに押し広げました。

1983年、ベクトレックスは新しいレベルのオーディオ合成を導入し、任天堂は1985年のニンテンドー・エンターテインメント・システム(NES)の発売で大きく前進した。ファミコンは、54Hzから28kHzまでの広い周波数帯域をサポートし、ピッチベンドを行うことができる5チャンネルのオーディオシステムを使用した。スーパーマリオブラザーズ』のような象徴的なゲームは、コインを集める時の「ピン」という音や、パワーアップ時の「キノコ」という音、「ジャンプ」という効果音など、印象的なサウンドでプロシージャルオーディオのベンチマークとなりました。

1986年になると、セガ・マスターシステムはゲームオーディオにさらなる進化をもたらした。サンプリングと電子合成の両方を取り入れ、4つのオーディオチャンネル(音楽用に3つ、効果音用に1つ)を使用した。マスターシステムには、ヤマハのプロ用シンセサイザーと同じYM2413チップが搭載され、生成できるサウンドの質と複雑さが大幅に向上した。

1988年にセガ・メガドライブ(ジェネシス)、1990年にスーパーファミコン(SNES)が発売されても進化は続いた。この2つのゲーム機は、より高品質なサンプルや、より豊かなサウンドスケープのためのチャンネル数など、より洗練されたオーディオ機能を導入した。

しかし、1994年にセガサターンが発売されるまで、ゲームオーディオの進化におけるもう一つの大きなマイルストーンを見ることはできなかった。44.1kHzのCD音質で最大16チャンネルのオーディオをサポートできるサウンドチップとサウンドプロセッサーを搭載し、現代のゲームに期待される高音質サウンドの舞台を整えたのだ。

録音済みの効果音と音楽

1994年、ソニーのプレイステーションが発売され、ゲーム界に大きな変化が訪れた。このゲーム機はオーディオ機能を大幅にアップグレードし、44.1kHzのサンプルレートと24チャンネルのステレオオーディオを提供した。プレイステーションのサウンドチップは、リバーブエフェクトやループ再生を可能にし、ゲームチェンジャーとなった。

新たな柔軟性を得たことで、作曲家やサウンドデザイナーは、より複雑で没入感のあるオーディオランドスケープを創造し、各プレイヤーの体験をより豊かなものにすることができる。

PlayStation時代以前は、ゲームのオーディオ制作にはオーディオプログラミングとプロシージャルオーディオの深い理解が必要でした。サウンドを作る人は、サウンドエフェクトや音楽を生成して実装するために、複雑なコーディングや信号処理に精通している必要がありました。そのため、非常に手間のかかる作業となり、音楽的な才能があっても技術的なスキルが低い人の創造性が制限されることがよくありました。

多くの点で、PlayStationは、録音済みのサウンドエフェクトや音楽をゲームに簡単に実装できるようにし、このプロセスに革命をもたらしました。コンポーザーやサウンドデザイナーは、プロシージャルサウンドの複雑さを気にする必要がなくなりました。代わりに、彼らは高品質の効果音や音楽を作ることだけに集中でき、それを開発者に渡してゲームに組み込むことができるようになったのです。

手続き型オーディオは流行遅れ?

録音済みの効果音や音楽が台頭しているにもかかわらず、プロシージャルオーディオは流行遅れとは言い難い。PlayStation以降のゲームの多くは、プロシージャルオーディオの数学的モデルを活用し続けている。最も人気のあるものをいくつか見てみよう。

プロシージャル・オーディオを使用した最新ゲーム

胞子

2008年の画期的なゲーム『Spore』では、オーディオ・プログラマーのアーロン・マクレーランとケン・ジョリーは、ダイナミックで没入感のある聴覚体験を生み出すために、高度なプロシージャル・オーディオ技術を採用した。

彼らは、Pure Dataの強力な機能を他のアプリケーションに統合するために設計された組み込み可能なオーディオ合成ライブラリであるlibpdと呼ばれるPure Dataの適応を使用した。Pure Dataを知らない人のために説明すると、Pure Dataはオープンソースのマルチメディア用ビジュアルプログラミング言語で、インタラクティブなコンピュータ音楽やオーディオの制作に広く使われている。

Libpdは、ゲーム内で無限に変化する変数に基づいて、音楽や環境音を生成することを可能にしました。例えば、プレイヤーがクリーチャーを作成し進化させると、そのクリーチャーが発するサウンドがリアルタイムで生成され、ユニークな特性や行動が反映されました。

このようにプロシージャルオーディオを使用することで、各プレイヤーがユニークで個人的なゲーム体験ができるようになった。

ノーマンズ・スカイ

No Man's Sky』もまた、プロシージャルサウンドデザインがいかに豊かでダイナミックなゲーム世界を作り出せるかを示す典型的な例です。開発チームは、プロシージャル生成されたゲームの世界に適応するサウンドトラックを作るというユニークな課題に直面しました。惑星や生態系、クリーチャーに至るまで、ゲームのアセットのほとんどがアルゴリズムで生成されているため、従来の録音済みのサウンドトラックでは不十分でした。

この課題に対応するため、Hello GamesのチームはWwiseのオーディオミドルウェア、特にVocAlienとして知られるカスタムプラグインを採用しました。このツールは、ゲームの多様でユニークなクリーチャーのボーカリゼーションを合成するのに不可欠でした。VocAlienは、サイズや種類など各クリーチャーの特徴に基づいてサウンドを生成し、各サウンドが適切かつユニークであることを保証します。

また、このゲームのプロシージャルオーディオシステムは、クリエイターが基本的にサウンドを「演奏」することを可能にしました。つまり、作成されたサウンドスケープは、静的な録音ではなく、クリーチャーの基本的なアニメーションや行動に基づいてリアルタイムで変化するダイナミックなオーディオ作品です。

その結果、探索中に聞こえてくる音は、画面上のアクションや環境条件と密接に結びついている。

エリート・デンジャラス

2014年に大ヒットしたオンラインSF宇宙探索ゲーム『Elite Dangerous』は、プロシージャルサウンドデザインを採用することで、ゲームにおける没入型オーディオの高い基準を打ち立てました。このゲームの開発者は、特に宇宙船のエンジンやグラフィカルインターフェースに、ダイナミックで適応性の高いサウンドを作成するためにプロシージャル技術を採用しました。

ミニ・メトロ

Mini Metroは、2015年に制作されたミニマルな地下鉄シミュレーションゲームで、プロシージャルオーディオを使用して、ゲームプレイを向上させる適応的で魅力的なサウンドトラックを制作しています。開発者のDino Polo Clubは、最初からプロシージャルな音楽の統合を目指し、ゲームのダイナミックな性質に合わせてプロシージャルなテクニックの強みを活用した。

作曲家のリッチ・ヴリーランドは、プレイヤーの行動と進化する地下鉄システムに反応するプロシージャルな音楽システムを使用した。ゲーム内の各都市には、リズムやハーモニーの選択など、独自の音楽的特質があり、プレイヤーがどのように地下鉄路線を構築し、変更するかによってダイナミックに変化する。

ジャストコーズ4

ジャストコーズ4では、プレイヤーが交通渋滞でNPC車両とすれ違う時に発生するフーッという効果音に、プロシージャルサウンドデザインが使われています。このエフェクトは、FMODオーディオミドルウェアのランタイム合成を使って作成されています。

このヒューヒューという効果音は、ホワイトノイズとブラウンノイズをブレンドして合成されました。ホワイトノイズは、異なる周波数で同じ強度を含み、一貫したヒューヒューという音を作り出しますが、ブラウンノイズは低い周波数でより多くのエネルギーを持ち、より深く柔らかい音を作り出します。

この2種類のノイズを異なる比率でミックスすることで、NPCの車までの距離、それらの車の速度、プレイヤーの車の速度など、ゲーム内のいくつかの変数に基づいて、合成音の出力を変化させることができました。

このアプローチにより、ゲームエンジンのサウンドエフェクトは、プレイヤーの行動や環境にダイナミックに適応できるようになりました。

最終的な感想 - プロシージャルサウンドデザインの未来に向けて

プロシージャルサウンドは、現代のゲームプレイに計り知れない柔軟性をもたらします。サウンドデザイナーは、プレイヤーのアクションや環境の変化にリアルタイムで反応するダイナミックで適応性のあるサウンドスケープを作成することができ、ゲームプレイの特定のコンテキストに合わせたサウンドエフェクトを提供することで、没入感とエンゲージメントを高めながら、各プレイヤーの体験をユニークなものにします。

しかし、プロシージャルオーディオの利点にもかかわらず、サンプリングされたオーディオは、最高の忠実性とリアリズムを達成するためのゴールドスタンダードであり続けています。事前に録音されたサンプルは、実世界のサウンドの微妙なディテールと自然な特性をキャプチャし、比類のないレベルのオーディオ品質を提供します。自分で合成する代わりに、サンプル・ライブラリにある何百万ものヒット曲のサンプルをプログラムしてみてはいかがでしょうか?

今後、プロシージャルな手法は進化を続け、従来のサウンドデザイン手法を補強していくでしょう。プロシージャルサウンドデザインとサンプリングオーディオを統合することで、ゲームクリエイターは両者の長所を活かし、よりダイナミックでリアルなサウンドスケープを実現できるようになるでしょう。

プロ・クオリティのマスタリングであなたの曲に命を吹き込みましょう!