Unreal Engine 5 ドキュメントは Epic Developer Community に移動しました

Unreal Engine 4.26

Unreal Engine 4.27

Unreal Engine 5.0

Unreal Engine 5.1

Unreal Engine 5.2

Unreal Engine 5.3

> メディアを使って作業する > オーディオとサウンド > オーディオミキサーの概要

Light Theme

Dark Theme

オーディオミキサーの概要

ゲーム内サウンドの再生に使用するオーディオシステムの概要。

Choose your operating system:

Windows

macOS

Linux

コンテンツ

背景と目的
オーディオミキサーのアーキテクチャ

オーディオミキサーは、独自のモジュールで動作するマルチプラットフォーム対応のオーディオレンダラです。これにより同等の機能をすべてのプラットフォームで実現し、従来のオーディオエンジン機能のほとんどに下位互換性を提供して、UE4 の機能を新しい分野に拡張します。このドキュメントでは、オーディオミキサーの構造について全体像を説明し、詳細な議論のための参照ポイントを提供します。

背景と目的

オーディオレンダリング

オーディオレンダリングは、音源をデコードして混合し (デジタル/アナログコンバータまたは DAC と呼ばれる) オーディオハードウェアエンドポイントに供給して、最終的に 1 つ以上のスピーカーで再生するプロセスです。オーディオレンダラのアーキテクチャと機能セットは大きく異なりますが、双方向性とリアルタイムのパフォーマンス特性が鍵となるゲームの場合、リアルタイムデコード、サウンドパラメータの動的な消費と処理、リアルタイムのサンプルレート変換、さらに音源ごとのデジタル信号処理 (DSP) エフェクト、空間化、サブミックス、リバーブのようなポストミックス DSP エフェクトなど、その他さまざまなオーディオレンダリング機能をサポートする必要があります。

プラットフォームレベルの特長：オーディオレンダリング API

通常はそれぞれのハードウェアプラットフォームが、フル機能で高レベルのオーディオレンダリング用 C++ API を少なくとも 1 つ提供します。複数のオプションを提供するプラットフォームもあります。多くの場合、こうした API はプラットフォーム固有のコーデックとエンコーダ、そしてデコーダ API を提供します。また多くのプラットフォームは、実行時のパフォーマンスを改善するハードウェアデコーダを提供します。コーデックに加えて、プラットフォームオーディオ API は、ボリュームコントロール、ピッチコントロール (リアルタイムサンプルレート変換)、空間化、DSP 処理など、オーディオエンジンに必要な他の機能をすべて提供します。

ゲームレベルの特長：ゲームプレイ API

ゲームエンジンには、こうしたプラットフォームレベルの仕様を元にした追加の機能が記述されています。例としてこうした機能は、(ブループリントなどの) スクリプトエンジンや (オーディオコンポーネント、アンビエントアクタ、オーディオボリュームなどの) ゲーム固有のコンポーネントとシステムにフックしたり、(サウンド並列処理など) どのサウンドを (サウンドクラス、サウンドミックス、サウンドキューなど) どのパラメータで実際に再生するか決定するために、多くの作業を行う場合があります。

プラットフォーム固有のオーディオレンダリング API に伴う課題

このパラダイムは、サポート対象のプラットフォームの数が少なく、新しいプラットフォームを立ち上げるリードタイムが長い場合は適切に機能します。しかし、多数のプラットフォームをサポートする UE4 の場合、それぞれのプラットフォーム固有の API の差異を処理して、プラットフォーム固有のバグを潰し、プラットフォーム機能の同等性を追求するうちに、オーディオエンジンの開発時間が容易に独占されてしまいます。これは新しいランタイム機能や開発ツールを作成するコストです。

このパラダイムで機能の同等性は不可能であるため、どのプラットフォームでどの機能が動作するかについて品質保証チームとサウンドデザイナーと連携する、機能サポート基盤を作成して維持する必要があります。これに関して、すべての機能がすべてのプラットフォームで動作するとは限らず、ドキュメントの提供とサポートは困難です。すべての機能がすべてのプラットフォームで動作せず、既存の機能がプラットフォームによって異なるサウンドになる場合、複数のプラットフォームに対して出荷することを意図としたゲームを混在させることは困難です。

したがって、オーディオレンダリングレベルの機能を新しく作成する場合はプラットフォームごとに異なる実装をする必要があり、そうしない場合はプラットフォームの不整合問題が増加します。同様に、最適化やバグ修正は複製を必要とし、そうでない場合は特定のプラットフォームに固有です。

つまりほとんどの場合、低レベルの新機能、最適化、バグ修正は、事実上不可能です。プラットフォーム API にパフォーマンスの問題や既知のバグが存在する場合、その多くはプラットフォームの開発元と協力せずには修正する手段がありません。そのため、ほとんどのバグ修正は工夫や回避策で構成されています。新しい機能が利用できる場合でも、それらは限られたプラットフォームのプラグイン API に追いやられ、プラットフォームが異なると動作しません。

新しいプラットフォームに対してそのプラットフォーム固有のオーディオ API を実装するには、膨大な作業量と長い開発リードタイムを必要とします。場合によっては、最新のプラットフォームではフル機能のオーディオ API を利用できない可能性もあります。このような場合は、そのプラットフォームがリソースを投資して独自のオーディオレンダリング API を作成するまで、そのプラットフォーム上ではオーディオレンダリングを利用できないでしょう。

あらゆるゲームエンジン向けに有効な手段の 1 つは、サードパーティが UE4 用に新しい機能と拡張を追加できることです。しかしプラットフォーム API の複雑な集合体と、それ自体がプラグイン拡張機能をサポートするさまざまな方法では、すべてをラップする共通の API を作成することはほとんど不可能です。

オーディオミキサーが解決策

こうしたすべての問題に対する解決策が、単一マルチプラットフォームのオーディオレンダリング API、すなわちオーディオミキサーです。オーディオミキサーにはプラットフォームすべてに共通のコードベースが 1 つ存在するため、機能の同等性をはるかに簡単に実現できます。プログラマーが新しい機能を一度実装すれば、すべてのプラットフォームで動作することが期待できるため、開発時間が最適化されます。また、テスト、ドキュメント、サウンドデザイナーの実装とミキシングも簡素化されます。避けられない特定のケースのサブセットを除き、異なるプラットフォーム間で同じように聞こえ、同じように動作します。

新しいプラットフォームを迅速にサポートします。多くの場合、必要なのはわずか数日、数百行のコードだけです。オーディオエンジンプラグインのインターフェースが非常に記述しやすくなるだけでなく、イノベーションの主要な手段になります。さらに、バグ修正やコードの最適化の恩恵をすべてのプラットフォームが受けます。

しかし、プラットフォーム固有の課題は依然として残ります。各プラットフォームが持つ CPU やメモリの機能、ハードウェアサポートオプションは異なるためです。それでも CPU やメモリが不足している場合、オーディオミキサーは (機能の無効化や品質を下げることなどで) CPU 負荷や、(クック時のメモリプルーニング、自動ダウンサンプリング、ダウンクオリティエンコーディングで) メモリ負荷を自動的に軽減する機能を活用できます。サウンドデザイナーとオーディオプログラマーは、オーディオミキサーを調整して特定のプラットフォームの固有のパフォーマンスとメモリターゲットを達成できます。

オーディオミキサーと呼ばれる理由

オーディオミキシング は オーディオレンダリング を言い換えた言葉です。ほとんどの場合、UE4 では レンダリング という言葉をグラフィックスについて使用するため、新しいオーディオレンダラを オーディオミキサー と呼ぶことにしました。しかし、 ミキシング という言葉のあいまいさのために、この決定がオーディオのコミュニティや他の関係者を混乱させている可能性があります。特にボリューム (ラウドネス) ミキシングの操作と混同することが考えられます。

UE4 オーディオミキサー は、本質的にハードウェアミキシングコンソールと同じことを行います。すなわちサブミキシングやマスターエフェクトプロセッサなど、さまざまなパラメーターとエフェクトプロセッサで処理した後に音源を追加します。

オーディオミキサーのアーキテクチャ

プラットフォームレイヤー

オーディオミキサーには、プラットフォーム固有の最小限の API レイヤーがあります。このプラットフォーム API は、さまざまなプラットフォームのオーディオハードウェアへのアクセスに必要な詳細をすべてラップします。また、このレイヤーはハードウェア機能のクエリを処理し、必要に応じてハードウェアの状態変更も処理して、マルチプラットフォームオーディオミキサーを設定してオーディオをハードウェアに供給します。

一部のプラットフォームでは、状態の中断、アプリの中断、デバイスの交換など、プラットフォーム固有のさまざまな微妙な差違を処理するには追加のコードが必要です。他には、ハードウェアアクセラレーションによるデコードなど、プラットフォーム固有の拡張機能を活用するためのサポートが追加されました。これらの場合、プラットフォーム固有のコードがさらにたくさん必要になる場合があります。このプラットフォーム固有のレイヤーは、さまざまなコーデック用にランタイムデコーダを作成するなど、UE4 の残りのプラットフォーム固有の機能もいくつか処理していることに注意が必要です。

バッファ生成

プラットフォームによって、ハードウェアにオーディオを供給する方法は異なります。たとえば、あるプラットフォーム API はオーディオをハードウェアのキューに プッシュ する仕様なので、クライアントアプリはオーディオをキューに供給し続ける必要があります。一方、他の API はコールバックベースなので、ハードウェアがさらにオーディオを必要とするときはクライアントのコードを呼び出します。どちらの場合でも、オーディオミキサーがマルチバッファスキームを採用しているため、ハードウェアが現在のバッファ (リッスンしているバッファなど) をレンダリングしている間に今後のオーディオバッファを生成します。

オーディオミキサーが次のオーディオバッファをレンダリングするのに長い時間がかかりバッファキューが枯渇する場合 (プッシュ API の場合)、もしくは API のコールバック時に使用できるオーディオがない場合 (コールバック API の場合)、再生に音飛びが生じます。これは Underrun (アンダーラン) や Starvation (枯渇) と呼ばれ、非常に不快に聞こえるので必ず避けてください。アンダーランは突然オーディオストリームに不連続を引き起こし、突発的なノイズとして認識されます。これは短いアンダーランのポップ、細切れに連続発生するアンダーランのスタッタ、または長く続くアンダーランによるオーディオの大きな抜け落ちのいずれかです。振幅の突然の変化がオーディオレシーバやスピーカーの損傷を引き起こす可能性もあります。ほとんどの場合、アンダーランの原因は、オーディオミキサーが割り当て時間内に過剰な処理を行ったことによる CPU の飽和です。別の場合としては、(非同期のデコードや合成を行う) UE4 タスクグラフのブロック、または他の問題を示している可能性があります。また、オーディオのクリックノイズやポップノイズの原因がアンダーランかオーバーランかを区別するのは困難な場合があります。

逆の例として、前もってオーディオを過剰に生成している可能性もあります。こうした場合はゲームイベントがリアルタイムからどんどん遅延し、レイテンシーとして認識されます。極端な場合は オーバーラン と呼ばれ、これも避けるべきものです。したがって、リアルタイムオーディオエンジンは、アンダーランとオーバーランの間でバランスをとる必要があります。アンダーランは何としても回避すべきですが、認識できるしきい値を下回るオーバーランは、アンダーランを防ぐためにある程度は必要です。

適切なバランスを見つけるのが困難な場合があり、また多くの場合はプラットフォームに依存します。そのためオーディオミキサーは、オーディオバッファーレンダリングごとにレンダリングするオーディオバッファサイズ、現在聞こえているバッファの前にレンダリングすべきバッファ数を、サウンドデザイナーやオーディオプログラマーがプラットフォームごとに選択できるように設計されています。

オーディオミキサーのスレッド化モデル

オーディオミキサーは独自のスレッドを作成して、実際のオーディオレンダリングを行います。これを オーディオレンダリングスレッド と呼びます。このスレッドは オーディオスレッド と異なり、DSP ソースの生成とミキシングの作業をすべて行うスレッドです。

オーディオスレッド は、再生するサウンドとそのパラメータ (サウンドキュー、サウンドクラス、サウンドミックス、減衰などの処理) の決定作業を行うスレッドです。このオーディオスレッドは、オーディオミキサーと従来のプラットフォーム固有のオーディオエンジンの間で、ほぼ同様です。しかし現在、オーディオスレッドには UObject とガベージコレクションの処理方法に複雑な部分があります。オーディオスレッドは UObject を持つため、ガベージコレクション中にフェンスされて停止します。実行中、これらの UObject は読み取り専用ですが、エディタではこれらの UObject に書き込み可能であるため、このオーディオスレッドは使用しません。

コールバックベースのプラットフォーム API には、実際のプラットフォームハードウェアコールバックが発生するハードウェアスレッドもあります。このハードウェアが所有するスレッドコールバックは、ほぼ常にレンダリングされたバッファから取り出され、これはオーディオレンダリングスレッドからキューに入れられ、実際の作業はほとんど行いません。

最後に、オーディオエンジンは UE4 タスクグラフから非同期タスクを利用して、デコードとプロシージャルなオーディオ (合成など) の生成を行います。

音源の生成

オーディオミキサーレンダリング自体の最初の段階は、ソースの生成です。ソースを生成するために、オーディオミキサーはゲームとオーディオスレッドから送信されたパラメータを受け取ります。これらのパラメータは再生する音源とそのパラメータ (ボリューム、ピッチ、位置など) を定義します。

ここで ソース という言葉を使用するのは、そのソース用に生成するオーディオが、圧縮オーディオアセット (サウンドファイルなど)、プロシージャルな生成 (合成、メディアのデコード、VOIP、マイクキャプチャなど)、他の混合ソースからのソース派生 ( ソースバス など) に由来するためです。それぞれの場合で、異なる方法を使用してソースデータを生成します。

エンコードされた音源

エンコードされた音源 (ogg-vorbis、opus、atrac9、xma2、adpcm など) の場合、非同期タスクを使用してオーディオを非圧縮 32 ビットの float バッファにデコードします。そして、この 32 ビットの float バッファは、ソースのサンプルレートからオーディオミキサーのサンプルレートに、サンプルレート変換 (SRC) されます。この SRC プロセスは、その音源に適用されている可能性がある ピッチスケール をすべて考慮して、そして 1 回だけ SRC を実行します。

たとえば、音源が 32 kHz でエンコードされサウンドデザイナーが音源をピッチアップするピッチスケールが 1.2 かつ、オーディオミキサーが 48 kHz でオーディオをレンダリングしている場合の SRC は次のサンプルレート比を使用します。

SampleRateRatio = (48 kHz/32 kHz) * 1.2

SampleRateRatio = 1.8

これはすなわち、オーディオをデコードした後、音源を 1.8 だけピッチアップすることを意味します。

プロシージャルな (生成した) 音源

プロシージャルな音源の場合、オーディオは、クライアントコードにコールバックして次の 32 ビット float バッファを生成する、抽象インターフェースを介して生成されます。クライアントコードはこのコールバックに任意のオーディオを供給することが可能で、理論的にはオーディオは任意のソースをとることができます。UE4 では、リアルタイム合成の実行、メディアソース (減衰、オクルージョン、リアルタイムエフェクトを含む 3D ビデオからのオーディオ再生など) からのオーディオのレンダリング、VOIP からのオーディオ再生に、これを使用します。

また、これはサードパーティのプラグインが、オーディオエンジンを拡張する数ある方法の 1 つです。プロシージャルな音源はプラグインで定義することが可能で、完全に独立したサウンドエンジンなど任意の他のソースから、オーディオミキサーに音源を供給できます。

混合ソース

オーディオミキサーは音源を混合して他のソースを作成することもサポートしています。こうした混合ソースを ソースバス と呼びます。ソースバスは他のソースと同様に扱われ、空間化、距離による減衰、ボリュームミキシング、ソースエフェクト処理など、他のソースが持つほとんどの機能をサポートします。これらの機能には便利なアプリケーションが多数あります。たとえば、新しい空間的場所への音源の動的ルーティング (ラジオ放送など)、空間化エフェクト処理 (位置に基づいたリバーブ処理など)、ディレイタイプの空間エフェクト (シーン内の特定のオブジェクトからの反響音など) があります。

音源の DSP エフェクト処理

一度音源からオーディオを生成すると、その出力は一連の オーディオ DSP エフェクト を介して供給されます。すべての音源が自動的に利用できるビルトインエフェクトがいくつかあります。こうした DSP エフェクトはハイパスフィルタとローパスフィルタであり、さまざまな高レベル機能に使用します。

サウンドの減衰設定 により、サウンドデザイナーは、ハイパスとローパスの機能のフィルタ頻度カットオフをマップして、リスナーからの距離の関数としてそれぞれの音源に適用できます。

このソースごとのフィルタを利用するもう 1 つの機能は、ビルトインの オクルージョンシステム です。オクルージョンを有効化した場合、サウンドが (非同期レイトレースで決定する) オクルージョンジオメトリの背後で遮られると、サウンドデザイナーが定義したローパスフィルタを自動的に適用します。最後に、サウンドミックスとサウンドクラスが、サウンドにソースごとのローパスフィルタを適用できます。

自動ビルトインフィルタエフェクトに加えて、サウンドを ソースエフェクトチェーン と呼ばれる機能でフィードすることもできます。これは、ソースエフェクトプラグイン API を介して、ソースごとの連続した DSP エフェクトを定義するアセットであり、コーラスエフェクト、フランジャー、ディレイ、高度なフィルタ、リングモジュレーション、ビットクラッシュなど任意のエフェクトを作成できます。

サブミックスグラフ

ソースを生成した後、オーディオミキサーは サブミックスグラフ を処理します。サブミックスグラフの出力が、オーディオハードウェアで聞こえるオーディオです。

サブミックスに送信する

オーディオエンジンを初期化すると、オーディオエンジンに マスターサブミックス が作成されます。既定では、他のサブミックスがベースサブミックスとして指定されていない場合、すべての音源が、その ベースサブミックス としてこのサブミックスに自動的に指定されます。

ソースのベースサブミックスは、ソース出力を、減衰後、空間化後に最大音量で混合するサブミックスです。送信サブミックスも任意の数だけ指定することができ、これは予備の DSP エフェクトを介して送信する前にソースを混合します。この送信サブミックスは、デジタルオーディオワークステーションやミキシングコンソールのリバーブなど、DSP エフェクトの予備チャンネルと類似しています。

前述のとおり、サブミックスルーティングを指定していない音源が使用できるデフォルトのルーティングがあります。ただし、音源がオーディオをサブミックスに送信する場所を制御する方法は主に 2 つあります。1 つ目は、ベースサブミックスの指定です。このサブミックスはサウンドを最大音量で混合します。空白のままにすると、レガシー機能によって、オーディオを EQ サブミックスまたはマスターサブミックスのいずれかにルーティングします。

マスターサブミックス

マスターサブミックスに加えて、 マスターエフェクトサブミックス を 2 つ作成し、このマスターサブミックスの子として追加します。この 2 つは マスターリバーブサブミックス と マスターイコライザー (EQ) サブミックス です。これらのマスターサブミックスは、主に UE4 のレガシー機能と下位互換を維持し、既存のプロジェクトでオーディオミキサーの交換に対応するために作成されました。ただし、これらはリバーブや EQ と相互作用するサウンドクラス、サウンドミックス、オーディオボリューム、サウンド減衰に対してさまざまな高レベル機能をサポートする、基礎となるメカニズムです。

出力を生成する

マスターサブミックスは、サブミックスグラフのルートノードです。このマスターサブミックスから生成したオーディオを取得することで、最終的な出力を生成します。

登録された音源を送信する量は、そのサブミックスで混合された音源のゲイン/減衰です。この混合バッファを、ハードウェアの出力チャネル構成に対して混合します。登録された音源を送信する量は、そのサブミックスで混合された音源のゲイン/減衰です。

この混合バッファを、ハードウェアの出力チャネル構成に対して混合します。たとえば、ステレオ出力の場合は 2 チャンネルのオーディオバッファになり、7.1 オーディオの場合は 8 チャンネルのオーディオバッファになります。

この混合したインターリーブオーディオがサブミックスの DSP エフェクトチェーンを介して供給され、最終的な出力を生成します。

サブミックスの追加機能：分析、記録、リスニング

サブミックスは、オーディオ分析を行う理想的なオブジェクトです。現在、チャンネルごとにサブミックスから振幅エンベロープの値を取得するブループリントデリゲートを登録するメカニズムがあります。これは、オーディオとやり取りするビジュアリゼーションやゲームプレイの多くのシステムに役立ちます。また、ブループリントのサブミックスからスペクトルデータを取得する、リアルタイム FFT デリゲートも用意されています。

さらにサブミックスには、出力を USoundWave オブジェクトやディスクの Raw PCM (.wav) ファイルに記録する機能もあります。

最後に、他のコードシステムで登録できる C++ デリゲートが用意されており、任意のサブミックスから混合したオーディオを動的に取得できます。この機能は、インターネットブロードキャスト (サーバーベースのゲームストリーミング) やサードパーティプラグインの拡張機能など、多くの場面で便利に使用できます。

タグ

audio

sound

Unreal Engine のドキュメントを改善するために協力をお願いします！どのような改善を望んでいるかご意見をお聞かせください。

調査に参加する

閉じる

オーディオ ミキサーの概要

ゲーム内サウンドの再生に使用するオーディオ システムの概要。

背景と目的

オーディオ レンダリング

プラットフォーム レベルの特長：オーディオ レンダリング API

ゲーム レベルの特長：ゲームプレイ API

プラットフォーム固有のオーディオ レンダリング API に伴う課題

オーディオ ミキサーが解決策

オーディオ ミキサーと呼ばれる理由

オーディオ ミキサーのアーキテクチャ

プラットフォーム レイヤー