
プラチナゲームズ株式会社 開発本部 技術戦略グループ オーディオプログラマー木幡周治氏とプラチナゲームズ株式会社 開発本部 企画開発グループ コアデザインチーム サウンドデザイナー 進藤 美咲氏は、CEDEC2017の講演で『NieR:Automata』(発売元:株式会社スクウェア・エニックス)での音響空間表現の実演および実装部分の解説を行いました。

音響的な空間表現は、音場の再現によってリアリティを高めることで没入感を向上させる目的以外にも、SEやVoiceの質感を揃えて馴染ませる役割があり、またそれによってBGMや背景など他の要素の印象に影響を与えることもあると木幡氏は説明します。『NieR:Automata』には、廃墟や大自然など風景を含めた空間を楽しむというコンセプトがあり、音場表現は非常に重要な要素となります。また、同作は広大なフィールドを持つため、自動制御を用いて膨大な作業量を軽減することも重要になります。

音響空間表現という言葉は様々な要素を含みますが、講演では「音源方角」「反響」「遮蔽」の3つに大別して説明が行われました。音源方角とはどの方角から音源が再生されたかを表し、反響は壁などの反射によって直接音より遅延して聞こえる音のことを表し、遮蔽は障害物による音の変化や地形による周波数帯に依存した減衰のことを表しています。

反射や回折、共鳴などの音要素は上記複数の項目に属する性質を持つため、上図では3つが重なるようになっています。これらをより細かく分類していくと、以下のような図になります。

例えば反射、回折、透過などは音源方角と遮蔽の影響が大きいですが、これら全てをリアリスティックに再現するのは困難であるために、要素別ではなく感覚別(主観的評価)によって音響空間表現を行っていくことになったとのことです。
家庭用ゲームである『NieR:Automata』では、ステレオスピーカーやサラウンドスピーカー、あるいはヘッドホンなど再生環境の違いに関わらず立体感を強調する必要があったと木幡氏は語ります。

これらを実現するために、「Simple3D」というプラグインが開発されました。進藤氏によるWwise上での実演デモでは、操作キャラクター「2B」の前にビーム発射音を再生し続けるオブジェクトが表示され、このオブジェクトがキャラクターの周りをぐるぐると移動することによって発生する音の変化を確認することが出来ました。

緑色の球体からはビーム音が鳴り続けており、キャラクターを中心に回転している。「Simple3D」を掛けた時はより立体感が強調された形となる。

「Simple3D」は処理負荷と位相の兼ね合いから信号処理はmonoで行われており、4kHz以上の高域と500Hz以下の低域のフィルター可変および周波数可変のバンドパスフィルターが搭載されている。
この「Simple3D」の実装時の評価は主観イコライジングという方式で行われており、方角ごとのイコライザパラメーターを記録し実装に利用しています。この場合正面はフラットになるため、キャラクターの目の前で効果音が再生された場合は原音がそのまま再生される仕組みになっています。Simple3Dの効果については、「3D配置されている音に対しSimple3Dの処理を行うことで、疑似サラウンドに似たような形で変化を分かり易く表現できる」と進藤氏は説明します。

主観イコライジングのテストは変化が分かりやすいようにPink noiseを用いて行われた。

続いては反響表現についての説明がありました。反響については方角よりも項目が多いものの、考え方としては「周囲の地形を自動的に利用することで、インタラクティブかつ気持ちの良い反響を作る」というシンプルなものだと木幡氏は説明します。シミュレーションの正確性を求めるよりも、音としての気持ちよさを求めていく過程で、「K-verb」というプラグインが開発されました。

これらの提案を実現するために「K-verb」と呼ばれるプラグインが開発された。プラグインネームの“K”は開発者のイニシャルとのこと。
『NieR:Automata』では、地形判定とリバーブ処理を別々に行っています。まずは地形判定ですが、こちらは1フレームに数本ランダム方角にレイキャストを飛ばし、衝突点を2秒間の寿命付きで記録、それらの衝突点群から水平8方角ごとの距離/反射率/フィルター強度を計算する仕組みになっています。その後、導き出された値から、「K-verb」によるリバーブ処理を行っています。「K-verb」ではリスナー角度を基に5chを絶対方向の8ch(8方向、東西南北など)に対し距離によって変化するDelay、材質によって変わるLPF処理を行い、その後リスナー角度を用いて4方向にコンバート後Mainにマージするような仕組みとなります。

地形判定ではレイキャストの衝突点群から水平8方角毎の距離/反射率/フィルター強度を計算している。

「K-verb」の信号処理。通常のAUXセンドと同様の流れで処理が行われるものの、仕組みは非常にインタラクティブなものとなっている。周波数特性を維持したまま時間軸を操作する目的で最終段にAPFが活用されているのにも注目。
「K-verb」の実演デモでは、ゲーム中の街にあたるレジスタンスキャンプ内の地形判定およびリバーブサウンドが確認できました。プレイヤー位置から1Fで数本、衝突した地点で2秒間保持されるレイキャストを飛ばし、ヒットした点に緑色の小さな点が表示されています。画面の右下にはサラウンドパンナーに近い見た目のビューワーがあり、こちらには現在プレイヤーがいる位置の広さが表示されています。
また、飛ばした衝突点の材質は土や石、鉄、鉄くずなどの材質に大別されて判定され、それぞれの材質に対して個別に反射率およびフィルター値の設定が可能になっています。デモ内ではその後バンカー通路から広い空間である司令官室に移動し、空間の変化に追従する残響変化が確認できました。

周囲の緑色の点はレイキャストの衝突地点。右下に表示されているのは地形の広さを表す図で、左下には地形の材質が数値化されたリストが表示されている。

レイキャストの衝突先の材質については反響以外にも利用されており、例えば草率が高ければ草の環境音が多くなり、周囲が覆われているときなどは風などの環境音が小さくこもるなどのサウンドデザインにも活用されている。

3つ目の要素である遮蔽表現ですが、これまでのように自動判定およびシステム化は行っておらず、既に運用されていたサウンドリエアツールの改良版を用いて実装を行ったとの説明がありました。この理由として、遮蔽に関わるゲーム内要素が複数存在する上に、遮蔽は周波数領域による挙動の違いが大きく、また巨大な機械生命体や滝のような物理的に大きな音源が多かったため、これらを正確にシミュレートするのは困難かつコストが高いことが挙げられました。
ただし、ゲーム的な演出においては、実際に遮蔽されているかどうかではなく、例えば「こちらに敵が気付いていないから音量を下げる、「部屋の奥に行くに連れて外の音を下げる」という、現実とは違う記号的な表現が没入感を高める結果にも繋がっていると木幡氏は語ります。

実演デモでは、大型の機械生命体が動いている中で建物に出入りし、ビルの遮蔽による音の変化を確認することができました。サウンドエリアの内部に入ると遮蔽が自動的に行われる仕組みで、複雑な建物の遮蔽エリアに対応するため各面に深度を設定することができるようになっています。

総評として、「Simple3D」による立体的な表現で動的な音の面白さを作り出し、さらにフィールドの大部分のインタラクティブな残響表現を「K-verb」でカバーするという仕組みは非常に良かったと進藤氏は語ります。これらはワークフローの改善にも繋がっており、従来のサウンドエリアツールを用いたリバーブ処理と異なり背景の完成を待たずとも作業が進行できるという利点もあったとのことです。また、写実的ではない派手なリバーブが欲しい場合は従来のサウンドエリアツールと併用することでゲーム的な演出にも対応できたそうです。



「近年ではハードの進化によって複雑なオーディオプロセッシングをゲームに活かせる時代になって来ており、こうした処理を挟み込む余地がようやくできてきた」と木幡氏は語ります。エンジニアの立場としては理論に基づいた写実的な表現を求めてしまいがちですが、サウンドデザイナーと綿密な協業を行うことで「音としての気持ちよさ」を加味した、サウンドデザインのやり易いプラグインが開発できたと講演を締めくくりました。

おまけで、講演者の進藤氏のネイルをご紹介。作品愛が伝わって来ます!