VAO++ 日本語解説

1.

EGSR2017 2017/09/19 今給黎隆 VAO++: Practical Volumetric Ambient Occlusion for Games J. Bokšanský1 , A. Pospíšil1 and J. Bittner2 1) Project Wilberforce, Czech Republic 2 ) Czech Technical University in Prague, Czech Republic

2.

Project Page： https://projectwilberforce.github.io/vaopaper/ Youtube: https://www.youtube.com/watch?v=_vzVxsMrxJ8

3.

VAO++: Practical Volumetric Ambient Occlusion for Games J. Bokšanský1 , A. Pospíšil1 and J. Bittner2 1) Project Wilberforce, Czech Republic 2 ) Czech Technical University in Prague, Czech Republic https://projectwilberforce.github.io/vaopaper/ どんなもの？高速なアンビエントオクルージョン（VAO法の高速化）先行研究と比べてどこがすごい従来提案されたVAOに対して、追加の制約なしにめだった品質の低減なしに高速化をした。具体的には適応型サンプリング、カリングの高速化と輝度感度、深度範囲チェックによる高品質化。カラーブリーディング対応技術や手法のキモはどこ？議論はある? 2π/9で回転したときに不変なポリファレンスとVAO++, Unity アッソンディスクサンプリング考え、 SSAOとの品質の評価が行われインターリーブサンプリングでのていない品質を上げるどうやって有効だと検証した? Unity Profiler で、VAO++とVAO及び、VAO++とUnity標準のSSAOの速度を比較次に読むべき論文は? 基礎として[SKUT10]

https://projectwilberforce.github.io/vaopaper/

4.

Abstract • アンビエントオクルージョンは、リアルタイムレンダリングアプリケーションで視覚的忠実度を高めるためによく使用される方法の1 つです。我々は近年導入されたボリューム的なアンビエントオクルージョン法に対して、いくつかの拡張を提案する。これらの拡張は、現在のゲームにおける品質対性能のトレードオフおよび幅広い適用性に特に重点を置いて、手法の特性を改善する。提案アルゴリズムの実装とその拡張について述べる。このメソッドをUnity ゲームエンジン内のカメラエフェクトとして実装しました。結果は、我々の実装がUnityの標準的なアンビエントオクルージョンと、品質とスピードの両方の点で優れていることを示しています。

5.

1. Introduction • • • • 最新のグラフィックスハードウェアは、詳細なジオメトリ、リアルなマテリアル、およびさまざまな照明効果をリアルタイムに複雑な動的シーンで表示するのに十分強力です。しかし、物理ベースの光輸送シミュレーションは、ゲームなどのリアルタイムアプリケーションでは依然として非常に複雑です。この問題に対処するために、影を扱うためのシャドーマッピング、鏡面反射を扱う反射マップ、または事前計算グローバルイルミネーションのためのライトマップなど、異なる照明効果を近似する多数の技術が設計されてきました。一般的な手法の1つは、近くのジオメトリによるオクルージョンを捕捉し、アンビエントライトの影響を計算することを目的とするアンビエントオクルージョン[ZIK98、IKSZ03、Lan02]です。多くの場面では、アンビエントライトは重要な照明成分であるため、アンビエントオクルージョンは、レンダリングされた画像の現実感の認識に大きく貢献します。最初のアンビエントオクルージョンメソッドはオブジェクト空間で動作し、前処理でアンビエントオクルージョンを評価しました[ZIK98、Lan02]。画面空間アンビエントオクルージョン[Mit07、SA07]の導入により、デプスバッファに保存された情報だけを使用してリアルタイムでアンビエントオクルージョンを近似することができました。いくつかの強力なスクリーン空間アンビエントオクルージョン法が、デプスバッファ情報および関連するアンビエントオクルージョン評価の異なる解釈を使用して提案されている。より最近の技術の1つは、Szirmay-Kalos ら[SKUT10] によって提案されたボリューメトリックアンビエントオクルージョン（VAO）である。この方法は、比較的少数のサンプルでもロバストな結果をもたらす体積積分として問題を定式化しています。我々は、ゲームのようなリアルタイムアプリケーションの性能を最大にすることを目的としたVAOのいくつかの実用的な拡張からなるVAO ++メソッドを提案する。特に、我々は出力の品質への影響を最小限に抑えてアルゴリズムを高速化する適応型サンプリングとカリングプリパスを提唱している。我々のソリューションは、オリジナルのVAO方式に対して2.4倍のスピードアップを達成し、組み込みのUnity SSAOの実装に関しては1.3倍のスピードアップを実現します。また、輝度感度、深度範囲のチェック、コンパクトなサンプルセットによる効率的なインターリーブサンプリングなど、結果の知覚される品質を向上させるその他の実用的な詳細についても説明します。 UnityゲームエンジンでのVAO++の実装について説明します。結果では、この方法が速度と知覚される品質の両方に関してUnityに実装された標準アンビエントオクルージョンよりも有利に働くことを示しています。

6.

1. はじめに • ゲームではGIは重い • 一般的に用いられている手法の一つがAO – [ZIK98、Lan02]: (オブジェクト空間の)最初のAO – [Mit07、SA07]: SSAO (リアルタイム!) – [SKUT10]: VAO(小数サンプル。ロバスト) • 提案法：VAO++ (VAOをいくつか拡張) – 高速化：適応型サンプリングとカリングプリパス • VAOの2.4倍、UnityのSSAOの1.3倍 – 高品質化：輝度感度、深度範囲のチェック、インターリーブサンプリング – Unityに実装

7.

2. Related work • • • • • アンビエント光を扱う最初の試みの1つは、古典的なPhong照明モデル[Pho75]のアンビエント項です。この項はグローバルなアンビエントイルミネーションを説明しますが、近くのジオメトリによるオクルージョンを考慮しません。 Zhukovら[ZIK98]およびIonesら[IKSZ03]は、入ってくるアンビエント光に関する表面上の点の近接性を評価することによって、入射光の補正を事前に計算することができることを初めて観察した。彼らは、距離の連続関数を使用して、近くのジオメトリの寄与により、遮蔽やアンビエントオクルージョンを調整しました。アンビエントオクルージョンは、産業界[Lan02]で迅速に採用されました。多くの場合、距離を考慮せず、与えられた距離閾値内の半球の非遮蔽部分が評価された簡略版のアンビエントオクルージョンが使用されている。動的シーンをサポートするためにKontkanenら[KL05]はアンビエントオクルージョンフィールドを提案し、その後、手法はアニメーション化されたキャラクタに拡張されました[KA06]。 Bunnnell [BE05]は、変形する表面を持つシーンを扱う方法を提案した。 Mendezら[MSC03]は色のにじむ効果を説明するよう提案した。これらの方法のさらなる拡張は、 HoberockおよびJia [HJ08]およびChristensen [Chr08]によって提案されている。前述の方法は、レイトレーシングや様々な表面の離散化方法に依存しています。インタラクティブな速度で複雑な完全に動的なシーンを扱うための新たな道が、画面空間アンビエントオクルージョン法[HJ08、Mit07、SA07、Ngu07、 CAM08]の導入によって登場しました。これらの方法は、デプスバッファの内容に基づいてリアルタイムでアンビエントオクルージョンを評価します。スクリーンスペースの方法は、より正確な環境照明と色にじみのためにディレクショナルオクルージョン[RGS09]を扱うように拡張されました。 Sainzら[Sai08]は、影付きの点から見たときに水平線を再構成することによって、アンビエントオクルージョンを評価する、ホライゾンベースアンビエントオクルージョンを提案した。 Szirmayら[SKUT10]は、体積積分に対するスクリーン空間AO評価の賢い再構成によるボリューメトリックアンビエントオクルージョンを提案した。我々は、この手法を最適化の基礎として使用し、手法を現代のゲームエンジンに統合するという実践的な問題について議論します。論文は次のように構成されています。セクション3では、VAOアルゴリズムの概要を説明します。セクション4は、VAO++ アルゴリズムの拡張を示しています。セクション5では、Unityにおける実装について説明します。 6章で結果を示し、最後に7章で結論を述べる。

8.

3. VAO Algorithm Outline • • • • • • • • • このセクションでは、VAOアルゴリズム[SKUT10]の概要を説明します。他のスクリーン・スペース・ソリューションと同様に、VAOは近傍の遮蔽物のみを考慮してオクルージョンに近似します。大部分のスクリーン空間アンビエントオクルージョン法は、与えられた半径（R）の半球の内側にある深度バッファの内容を分析する。半球の体積がサンプリングされ、アンビエントオクルージョンは、包含されていないサンプルの割合として計算される。これとは対照的に、VAO はサンプリング領域を表面法線に沿って移動した半径R/2のより小さなタンジェント球に巧妙に変換します（図2）。アンビエントオクルージョンは、接線球の閉じられていない体積の割合として計算されます。このような変換は、より効率的なサンプリングボリュームにつながる、より密な局所的な近傍（タンジェント球は通常使用される半球の4分の1 の体積を有する）を生成する。これは実装を簡単にする：コサインを計算する必要はなく、生成されたサンプルはすべて、（カメラ空間内での）Z軸に垂直な接平面の中心にある半径R=2 の円盤内にあります。各サンプルは、カメラから与えられたサンプルまでのレイに対応する正接球と交差するボリューム（パイプ）を表します。各サンプルについて、対応するパイプの非遮蔽部分が計算される（最適化として、各サンプルについて非遮蔽パイプの全長を事前に計算することができる）。次に、各サンプルについて、以下の3つのケースのいずれかが発生する（図3）。ケースA：タンジェント球の内部でオクルージョンが発生するケースB：オクルージョンが発生しないかシーンの深いところでオクルージョンが発生するケースC：タンジェント球に達する前にオクルージョンが発生する遮蔽されていないパイプセグメントの体積は合計され、タンジェント球の総体積で除算されて非遮蔽体積を表す。点xのボリューメトリックアンビルオクルージョンV（x）は、タンジェント球にまたがる円板を一様にサンプリングすることによって計算される： • ここで、nはサンプル数、Dziはi番目のサンプルに対応するパイプの長さ、RはAO カーネルの幅、Fはタンジェント球SJの体積をR^2π/（4n）で割ったものです。 Fの解析的計算は可能であるが、推定値の相関誤差によるより良い結果が得られるので、数値近似を使用する[SKUT10]。 • VAOアルゴリズムは、3つのパスで動作する。（1）オクルージョンをテクスチャに計算する、（2）高周波ノイズを除去するローパスフィルタを適用する、（3）シェーディングを実行する、すなわちオクルージョンをカラーバッファに適用する。

9.

図2: 従来のAO（半球）とVAO（タンジェント球）の検索体積の比較図3:ラインサンプルの3つの可能なケース。ケースA：パイプが部分的に閉塞されている、ケースB：パイプが完全に閉塞されていないケースC：パイプが完全に閉塞している。

10.

VAOアルゴリズム概要 (1/4) • 通常のSSAO:描画ピクセルから法線の向きを中心に半球の領域で遮蔽される割合を評価 • VAO:描画ピクセルの前に半径R/2の球(タンジェント球)を置いて、球の遮蔽割合を評価(cosθが積分範囲に考慮されている) n n R R 図2: 従来のAO（半球）とVAO（タンジェント球）の検索体積の比較

11.

VAOアルゴリズム概要 (2/4) • • • • 描画点の法線からタンジェント球の中心を導出タンジェント球の中心から視線に垂直な円板を生成円板上をサンプリングサンプル点において視線方向にタンジェント球と深度の交差を計算 • サンプル点での可視割合を評価

12.

VAOアルゴリズム概要 (3/4) • Volume Ambient Ocullusion 半径R/2の面積をn個のサンプル点で割ってそれぞれの長さを掛け合わせる遮蔽されない体積球の体積球の体積を使うと、サンプル点の位置に応じて球の体積の誤差が生じるが、この近似は深度の遮蔽割合なのでそのような問題が出ない =Σ|zexit-zentry|

13.

VAOアルゴリズム概要 (4/4) 1. オクルージョンを計算してテクスチャに出力 2. 高周波ノイズを除去するローパスフィルタを適用 3. シェーディングを実行 – オクルージョンをカラーバッファに適用

14.

4. The VAO++ Algorithm • オリジナルのVAOアルゴリズムを拡張して、パフォーマンスを向上させ、一般的なアプリケーションの使用事例での効率を向上させます。提案されたVAO++アルゴリズムの拡張およびその他の重要な部分については、このセクションで説明します • 私たちの拡張機能は、幅広いシーンで効果的に機能します。拡張が依存している発見的問題解決法は、違いが目立たない領域、すなわち適応サンプリングの場合の遠隔ジオメトリ、およびカリングプレパスのためのオープンサーフェスでパフォーマンスを得ることに焦点を当てています • これらの方法は一般的ではありませんが、特にこのようなケースが一般的に現れるゲームではうまく機能します

15.

4.1. Adaptive Sampling • • • • 既存のAOメソッドは、通常、使用するサンプル数を含むグローバルに指定された品質設定を使用します。適応型サンプリング拡張の考え方は、（透視投影のために）サンプリング半径がより小さいカメラからより少ないサンプルを使用することであり、したがって、同じレベルの品質を達成するのにより少ないサンプル数しか必要としない。言い換えれば、我々は、パースペクティブ変換後のイメージ空間において同じサンプリング密度を維持しようとする。 VAOでは、サンプリングカーネルは常に画面上にディスクとして表示されます（他のアルゴリズムのように半球ではありません）。したがって、透視投影後のディスクの表面積に基づいて適切な数のサンプルを選択するのは簡単です。ユーザに、使用する最小のサンプル数を相対スクリーン空間座標系で円盤の直径を設定させる。このため、この方法は異なる解像度で同じ方法で動作し、ユーザーに複数の事前定義された品質オプションを与えることも可能になります。この事前定義された距離で使用されるサンプルの数は、最小（すなわち、2サンプル）に設定され、最大数のサンプルに達するまで、サンプリングディスクの表面積が2倍になるたびにサンプルの数を2倍にする。この実装は、2,4,8,16または32サンプルの事前計算サンプルセットから選択します。これらのサンプルはすべてGPUシェーダにサイズ62の単一の配列として送られます。このようなサンプルセットは、GPUに送信される配列サイズの実際的な制限（100個）に適合し、できるだけ多くのターゲットプラットフォームをサポートします。

16.

適応型サンプリング • タンジェント球から作られる円板の面積からサンプリング数を決定 – – – – 透視変換で円板の面積は距離に応じて減少面積が２倍になるとサンプリング数を2倍ユーザーが最低サンプリング数を設定可能サンプリング点のパターンは、2,4,8,16,32のサンプリング数毎に計算され、62個の配列としてGPUに送られる

17.

図4: 適応型サンプリングのレベルの可視化。後ろから前に4，8，16，32サンプル

18.

4.2. Culling Pre-pass • • • • ほとんどの場面では、アンビエントオクルージョンは画像の一部の領域（角、亀裂など）にのみ現れます。他の領域では、計算は不要で省略することができます。カリングプレパスは、オクルージョンのない領域ではAO計算を省略するように設計されたテクニックです。まず、より低い解像度のテクスチャ（最終イメージの1/8解像度を使用）でAOを計算し、 AOが発生する領域を推定します。このパスでは常に8サンプルを使用します。この低解像度テクスチャ内のAOを計算することは、理論的に64倍高速であり、従って非常に安価である。 2番目のパスでは、低解像度テクスチャで遮蔽された領域のAOのみを計算します。より高い解像度とサンプリングカーネルサイズのために、このステップは品質損失を最小限に抑えてパフォーマンスを大幅に向上させます。これは、比較的大きなテクスチャで効果が適用される VRのための「シングルパスステレオレンダリング」技術で設計されました。第2パスで推定されたオクルージョンをチェックすることは、与えられたピクセルコーナーにおける縮小されたAOテクスチャからの4つのテクセルフェッチを介して行われる。テクスチャ補間モードは線形に設定されているため、24×24の領域をカバーする8つの周辺ピクセルから補間された結果が得られます。これらのピクセルの少なくとも1つがオクルージョンを示す場合、完全なAOを計算する。そうでない場合、ピクセルはカリングの候補となる（図5および図6）。カリング候補ピクセルを処理するために、我々はこの手法の2つの変種で解決した。１つ目は「貪欲」と呼んでおり、 AOが推定されずに計算は完全に省略さます。これは、推定が小さな細部を検出できない場合、8×8サイズの白い線または四角形を点滅させる可能性があります。大きなAO半径を使用する場合、貪欲型の場合はアーチファクトをほとんどまたは全く生じず、高性能ブーストとして使用できます。これは明らかにシーンに依存しており、それは問題になるはずであり、我々はこの方法の第2の「慎重な」場合に落ちる。この技術は、選択された品質に関係なくAOが推定されない領域で4サンプルのオクルージョンを計算します。これらの領域には細部（8×8ピクセル以下のサイズ）しか含まれていないため、4つのサンプルで十分な品質が得られます。「慎重な」カリングプレパスの品質損失はほとんど目に見えず、実装ではデフォルト設定でオンになっています（図7）。

19.

カリングプリパス • 1/8解像度で8サンプルで計算 • プリパス遮蔽がなかった画素に対応する領域ではAO計算を実行しない – 縮小バッファの4点をサンプリング • 線形補間で(3*8の)24ピクセル分を評価 • 実際の評価方法 – 貪欲：縮小バッファで遮蔽がなければ処理しない • 高速だが、白い四角形のアーティファクトが生じうる – 慎重：縮小バッファで遮蔽がなければ4サンプルで処理 • 8サンプルでは出ない情報なので、4サンプルで十分（ディフォルト設定）

20.

図5:カリングプレパスのイラスト。オクルージョンが推定されない領域は、カリングされます（白で示されます）。詳細に計算される領域は黒で表示されます。図7: （左）VAOに「欲張り」なカリングプレパスがあります。白い四角形のアーティファクトを注意してください。（中央）「慎重」なプレパスは結果を大幅に改善します。（右）カリングプレパスなしのリファレンス。画像はアーティファクトを誇張するようにガンマ補正されています。図6: カリングプリパスを有効にしたシーンの結果

21.

4.3. Luminance Sensitivity • • • • SSAO法で共通な問題の1つは、幾何学的なシーン情報のみを考慮することです。そのため、通常、光源やエミッシブまたは鏡面のようなアンビエント影が現れないようなサーフェス上にオクルージョンを描画します。これらの欠陥に対抗するために、我々は輝度感度拡張を提案する。輝度感度は、評価された表面の明度（輝度）に基づいてアンビエントオクルージョンを抑制する（図8）。この方法では、AO成分を減らすためにユーザが指定した輝度閾値を使用する。与えられた点xについて、輝度補正アンビエントオクルージョンAOL（x）は次のように表される: ここで、AO（x）は入力アンビエントオクルージョン、lum（x）はxのRGBカラーから計算された輝度を表し、thresholdはユーザー指定の閾値、widthおよびsigmaは補正関数のプロファイルを定義する定数です。代替として、輝度の代わりにHSVカラーモデルのV成分を使用します。この結果、色相の色成分に依存しない結果が得られます。輝度感度カーブの例を図9に示します。

22.

輝度感度 • 光源、エミッシブや鏡面でのAOを消す – 明るさに応じてAOの効果を下げる • HSVのVを使うと色相に影響しなくなる [0,1]クランプ画素輝度輝度がwidthぐらいになると0になるグラデーションの調節

23.

図8:AOなしのシーン、輝度感度のないAO、輝度感度を有効にしたAO 図9:さまざまなシグマ（直線性）設定の輝度感度曲線。閾値は0.5に、幅は0.3に設定

24.

4.4. Depth Range Check • • • シーンのジオメトリの近似として深度バッファを使用する最大の欠点の1つは、シーンの遮蔽された部分に関する情報の損失です。追加の情報源がなければ、VAOアルゴリズムはすべての遮蔽体を無限に厚いものと見なします（VAO法のケースCを参照）。これにより、オクルージョンが発生しない領域では、望ましくないシャドウアウトラインが発生することに注意してください（図10）。デプスピーリング[Eve01]や他のカメラからの情報の取得[VPG13]など、この問題に対処して現実的な結果を生み出すための方法については、過去に多くの提案がありました。しかし、これらのソリューションでは、パフォーマンスのオーバーヘッドが大きくなります。我々は、視覚的に満足のいく結果を生み出し、ユーザからの追加の設定を必要としない高速な方法を提案する。無限に厚い遮蔽物を考えるのではなく、それらは平らであり、厚さが徐々に減少すると仮定します。与えられたサンプルが完全に内部の幾何形状（VAOケースC）である場合、減衰関数（式4）で表されるオクルーダーからの距離に応じてオクルージョンを減少させます。多くのテスト関数から、我々は審美的に最良の結果をもたらしたものを選択した。この関数は本質的に、カメラが見るものの背後にあるジオメトリの厚さを表します。 s(d)は、カーネル半径を考慮して、ビュー空間座標系で遮蔽物の背後の距離dにあるサンプルのオクルージョン寄与を表します。サンプルの重み（タンジェント球と交差するパイプの長さ）は、s（d）を乗じることによって減少し、距離が増すにつれて徐々に遮蔽を減少させる。パラメータuは、深度バッファの数値不正確さによって引き起こされるアーティファクト（自己遮蔽）を抑制するために、一定量だけ厚みをオフセットします（図11）。我々は、経験的に選択された値0.03を手法の実装で使用することで、深度不連続性を有する領域において滑らかな遷移を生成し、ハローアーチファクトを顕著に抑制する。

25.

デプス範囲チェック • 通常は、遮蔽物の厚さは無限大と考える – z*より後ろは中身が詰まっている • VAO++では、遮蔽物の厚さS(d)を距離に反比例して薄くする – 効果を下げる – 関数形は一番いい感じの物適当な最小クランプ d

26.

図10: （左）元のアルゴリズムによる可視シャドーアウトライン。（右）奥行き範囲チェックで訂正された結果。図11:カメラから見るジオメトリの厚さを表す減衰関数。

27.

4.5. Samples Generation • • • • • • • 最終的な視覚結果の最も重要な要素の1つは、オクルージョンボリュームを推定するために使用されるサンプルセットの品質です。 VAOアルゴリズムは、半球内のサンプルという3次元分布を使用する従来のSSAO手法とは対照的に、接線球の円内に分布するサンプルを使用します。私たちは、異なる（しかし対称的な）サンプルセットを得るために、各画素のサンプルセットを均一に分布した角度で回転させることによるインターリーブサンプリングを採用します。我々は、3×3ピクセルタイルの回転角度の繰り返しパターンを使用します。実験的に我々は、3×3のタイルサイズが、高い視覚的品質をもたらすのに十分であり（サンプルの数は9倍に事実上増加する）、一致するサイズの高速ローパスフィルタによって完全に除去するのに十分小さいことを立証した。したがって、9回回転させた後に均一なサンプル分布を生成するサンプルセットを生成する必要があります。我々は、生成中に回転を考慮したコンパクトなサンプルセットを生成するポアソンディスク分布に基づくサンプル生成器を使用する。この方法の主な目的は、試料の不均一な分布によって生じるバンドアーチファクトの減少である（図12参照）。我々のポアソンディスクサンプル生成器は、サンプルの将来の回転を考慮に入れます（図13）。我々は回転のために9つの均一なステップ角を使用する。これは、回転をカスタムテクスチャからフェッチする必要はなく、UV座標から計算できるというメリットがむしろあります（これは約 1％のパフォーマンス向上をもたらしました）。私たちのジェネレータは、新たに追加されたポイントだけでなく、それらのローテーションのすべてを保存します。別のポイントがサンプル候補として考慮されている場合、このアプローチは、それらの回転を含む他のすべてのポイントから十分に離れていることを保証します。ポアソンディスクサンプル分布を生成した後、回転サンプルの最良の順列を選択して、互いの距離の合計が最大となるようにする。これは、回転によって導入されるノイズをさらに低減する。サイズが8以下のサンプルセットでは、すべての順列をテストすることが可能です。大きなセットの場合、8つのサンプルのグループを段階的に追加し、固定されたそれまでのグループとの最適な順列を探します（図14）。最後に、サンプルをzオーダーに従ってソートし、シーン内で空間的に近接するサンプルをメモリ内でも互いに近くします。これにより、深度テクスチャおよび法線テクスチャからデータをフェッチしている間のキャッシュのコヒ―レンシーが向上します。上述のアルゴリズムから生成されたサンプルセットはまた、本方法の適応サンプリングステップにおいて異なるサイズのセット間の遷移の視覚的品質を改善します。

28.

サンプル生成 • AO計算では、少ないサンプリングで高品質な物が得られることが望ましい。 • VAOでは、円板上でのサンプリングを行う – 円板内で一様なポアッソンサンプリングを用いる • インターリーブサンプリング(3x3)を行う – 9回転して均一なサンプリングパターンを作る – 同じサイズのぼかしフィルタで高周波ノイズは除去インターリーブサンプリングの適当な回転（論文に記載なし） 1* 2π/9 5* 2π/9 3* 2π/9 7* 2π/9 0 8* 2π/9 4* 2π/9 6* 2π/9 2* 2π/9

29.

分布の生成 • サンプル数ごとに、９回転させたときにポアッソン分布になるようなサンプルを生成 • 生成したサンプルについて、自由に回転させたときにサンプル間の距離の総和が最大になるように再配置 • サンプル数が多いときは8サンプルの結果に追加して生成 • Z値でソートして、深度バッファと法線マップのキャッシュヒット率を上げる

30.

図12: 発生時にサンプル回転を考慮してバンドアーチファクトを低減する。（左）回転を認識しないポアソンディスク分布。（右）提案された方法によって生成されたサンプルセットを使用。

31.

図13:後で回転した一様分布と生成時に回転を考慮した修正分布（ 9回転を掛けた16サンプル）の比較。図14: ：ポアソンディスクジェネレータで生成されたサイズ4のサンプリングカーネル（左）。回転にベストな並び替え（中）。すべての回転（右）。

32.

4.6. Low Pass Filter • • • • AOを計算するために少数のサンプルを使用する場合、アンダーサンプリングによってより多くのアーチファクトが生じる。これは、2および4つのサンプル（また、半径によっては8つのサンプルでも）で発生します。これらのアーチファクトは、少数のサンプルがシーンのジオメトリを適切にサンプリングするのに十分でないため、ギザギザのエッジを含むオクルージョンとして表示されます。これらのアーチファクトを除去するために、可変サイズのガウスぼかしをオプションとして提供する。ユーザーは、畳み込みカーネルのサイズとガウスベルカーブの偏差を設定して、アーチファクトの量と「ぼやけ」のバランスを微調整することができます。我々は、非線形のクロスバイラテラルフィルタを使用します：事前定義された閾値を超える奥行き変化を持つ隣接ピクセルを考慮しません。閾値として、ワールド/ビュー空間座標系のAO半径を用い、各ピクセルの線形ビュー空間の深さを計算します。深さ認識部分を省略すると、この小さなサイズのたたみ込みの場合でも深度不連続点を持つ領域には不安定なハローアーチファクトが発生します。より大きいカーネルサイズの畳み込みフィルタはパフォーマンスが悪いため、フィルタが分離可能であるかのように（技術的にはそうではありませんが）2パスでフィルタを実装します。深度不連続がフィルタをカーネルの対角線上に分割する最悪の場合のシナリオでも、非常に良い結果が得られます。

33.

ローパスフィルタ • サンプル数が少ないと階段状のアーティファクトが発生 • 可変サイズのガウスぼかし 2 4 – クロスバイラテラルフィルタ • 深度差が閾値（AO球の半径）を超えたら無視 8 – ぼかすサイズが大きいときは２パス • 正確ではないが良好 16

34.

4.7. Color Bleeding • 他のいくつかのSSAO法と同様に、1回の間接的な光のバウンスの近似によるカラーブリードの単純なシミュレーションを使用する。このエフェクトを追加するために、アルゴリズムは（深度と法線によって表される）ジオメトリだけでなく、サーフェスの色もサンプリングする。私たちは、陰影のある表面におけるサンプル位置と法線の構成に基づいて各サンプルの寄与を計算します。特に、サンプルxの注目点pへの間接寄与の量を次のように計算します。 • ここで、nは表面法線であり、radiusはAOカーネルの半径である。我々は、c(x)を用いて、白色とサンプリングされた色との間を線形補間する。二次バウンスのために同じサンプルを再使用する際の問題は、サンプルが空間的にジオメトリの内部に深くありうることから生じますが、正しい結果を得るためにはジオメトリサーフェスをサンプリングしたいです。これは、陰影を計算する表面から光線に沿って衝突する表面の位置のサンプルまでレイマーチングする必要がある。このような操作は、コストが高く、実用的ではない。もう1つの解決策は、表面近くに位置しないサンプルを廃棄することです。しかしながら、これは使用可能な結果を提供するためにあまりにも多くのサンプルを捨てる。我々の方法では、この要件を緩和します。表面上にあるかどうかにかかわらず、すべてのサンプルを使用します。レイの出発点に近い表面があるときに問題のあるサンプルが発生するという事実に着目します。これは、その領域の強いアンビエントオクルージョンによってその寄与が隠されることを意味します。これにより、良好な結果とパフォーマンスが得られます。さらにパフォーマンスを向上させるために、2つまたは4つごとにサンプルを取る、半分または四分の一のサンプルを使用してカラーブリードを計算します。サンプルはzオーダーであるため、円の全体を均一にサンプリングします。 • •

35.

カラーブリーディング (1/2) • サンプルでの色に重みを付けて合成 – 重みc(x)で白色と線形ブレンディング法線サンプル点注目画素 AO球半径

36.

カラーブリーディング (2/2) • サンプル点は物体の内部に発生しうる – サンプル点からの表面探索はレイマーチングが必要で重い – 注目から遠い色を無視する方法もあるが、非効率 • 提案法では、すべてのサンプル点を利用 – 注目画素に近い点の寄与が問題になることが多いが、アンビエントオクルージョンの効果も強くなるので無問題 – ２，４サンプル毎に評価することで高速化可能 • zソートされているので、均一に評価される

37.

5. Unity Implementation • VAO++は、ピクセルごとの法線を生成し、デプスバッファへのアクセスを提供するレンダリングソリューションに実装できます（現代の遅延レンダリングされたレンダラー）。効果は、単にオクルージョン値を乗算によって結果の画像に適用します。これは、レンダラの結果を入力として取り込み、画面に新しい結果を生成する追加のレンダリングパスとして一般的に実現されます。我々は、人気と使いやすさのためにUnityを選択しました。 • Unityはカスタムポストプロセッシングエフェクトで拡張可能なように設計されています。エフェクトは、シーングラフのカメラノードに普通にアタッチされるイメージエフェクトとして、または既存のレンダリングパイプラインを拡張するグラフィックスコマンドのリストであるコマンドバッファとして実装できます。私たちの実装では、特定のデプロイメントプラットフォームでの互換性の問題を解決するために両方のオプションを提供しています

38.

5.1. Image Effect Implementation • Unityでの画像エフェクトとしてのVAO++の実装は、他のUnityコンポーネントと同様の動作をするため、非常に直感的です。 • ユーザーは、画像エフェクトが適用される順序を完全に制御できます。実装は、1組のシェーダとスクリプトファイルで構成されています。 OnRenderImageイベントが発生すると、スクリプトはシェーダをロードして実行します。また、GUIコントロールが含まれており、選択した設定をシェーダーのユニフォーム変数を介してGPUに送信します。シェーダファイルには、複数パスの頂点シェーダとフラグメントシェーダとしてのイメージエフェクトの実装が含まれています。 • 画像エフェクトのアプローチから生じる問題の1つは、すべてのレンダリングパスが終了した後のポストプロセスとして適用されることです。これにより、透明なプリミティブ、前にかけられたエフェクト、HDRレンダリングが有効になっている場合は、明るく点灯したサーフェスにもアンビエントオクルージョンが置かれます。

39.

5.2. Command Buffer Implementation • コマンドバッファを使用するVAO++の実装はより複雑であるが、エフェクトは、想定されるレンダリングパイプラインに挿入することができる。すなわち、すべての不透明プリミティブがレンダリングされ、照明が計算される前である。しかし、これは、画像エフェクトが与えられたシーンに適用される順序を制御することを難しくします。実装は画像エフェクトとシェーダファイルを共有し、有効にすると OnRenderImageイベントをバイパスします。代わりに、 OnPreRenderイベントでコマンドバッファを満たし、レンダリングパイプライン内で処理するためにそれを送信します。コマンドバッファ自体には、テンポラルテクスチャを作成し、アルゴリズムの必要に応じて特定のシェーダパスを実行するためのコマンドが含まれています。

40.

5.3. VAO++ Shader • • • • • 我々はOpenGL/GLSLのプロトタイプの実装から始めて、プラットフォーム特有の問題を取り除き、アルゴリズムを微調整しました。その後、Unityが使用するCg/HLSL言語にシェーダを書き直しました。 Unityは特殊なテクスチャ_CameraDepthNormalsTextureを介してG-Bufferへのアクセスを提供します。最初の16ビットにビュー空間の法線と残りの16ビットに線形深度がパックされます。圧縮されてパックされた深度と法線をデコードするには、組み込みマクロのDecodeDepthNormalを使用します。深度はすでに線形化されて、<0,1>の範囲であるため、ほとんどの他の実装の様に、逆数から再計算する必要はありません。深度と法線はそれぞれ16ビットに圧縮されるため、精度は現代のGPUで得られる精度よりも低くなります。設計のおかげで、このアルゴリズムはこれらの不正確さに対してかなり抵抗力があり、同様の効果でよく見られる魔法のバイアス変数を必要としません。陰影計算するピクセルのビュー空間の位置は、リプロジェクションによって計算されます。頂点シェーダでは、各スクリーンコーナーの位置が、（CPU上で事前に計算された）投影行列の逆行列を使用してスクリーン空間からビュー空間に再投影される。結果として得られる頂点シェーダの値は自動的に補間され、フラグメントシェーダでは、カメラから描画ピクセルの遠方平面への方向ベクトルとなります。このベクトルは正規化され、ピクセルのビュースペース位置を得るために深度値で乗算されます。

41.

6. Results and Discussion • • • • • • このセクションでは、さまざまなVAO++拡張がアルゴリズムのパフォーマンスに及ぼす影響を示します（表1）。すべての測定は、NVIDIA GTX 970グラフィックスカードで実行され、Unity Profilerで測定されました。私たちの主要な最適化は、それぞれ異なる画像解像度とサンプル数に対する影響の程度をより良く示すために別々に測定されます。また、結果をUnityポスト処理スタックプラグインに含まれるUnity SSAOと比較します。最後に、様々な距離とジオメトリにおける手法の挙動を示すために、異なるシーンのサンプル画像を含めます（図17）。カリングプレパスは、サイズが8以上のサンプルセットのパフォーマンスで向上が見られます。これは、カリング候補のオクルージョンが常にサンプル数8で計算されるために発生します。このアルゴリズムのダウンサンプリングの性質は、高分解能の高速化にもスケーリングします。カリングプレパスは1080pで30％、 4k解像度で40％のスピードアップを達成します。アダプティブサンプリングによるパフォーマンスの向上は、サンプルセットのサイズとともに徐々に増加します。サンプル数が多いほど、距離が遠いほどサンプル数が減少します。表2と図15に、VAO ++とUnity SSAOの比較が含まれています。両方の方法は、ほぼ同じサイズのAO影を作るように設定されていました。 16サンプルの場合、VAO ++Unity SSAOより1080pでは約20％高速で、4kでは30％以上高速です。また、 VAO++サンプルセットのサイズをさらに2倍にすると（32サンプル）、1080pで16サンプルのUnity SSAOよりもわずか15％遅く、、4kでわずか3％遅いことにも注意してください。 VAO++のビジュアル結果はレイトレースAO（図16）に近く、カメラの移動や動的オブジェクトの場合にも生成された影の形状が保持されます。 VAO++はUnityのSSAOのような大きなローパスフィルターを必要とせず、シーンのジオメトリによく合ってより現実的に見える鮮明な画像と影が得られます。私たちはまた、より良い結果をもたらすと信じるより積極的なレンジチェック機能を採用し、不必要にシーンを過度に暗くしません。パフォーマンス向上を目的とした我々の拡張は視覚品質にはほとんど影響しません。カリング・プレパスは無視できるサイズのアーチファクトを引き起こし、適応サンプリングはカメラから離れた領域にのみ影響します。サンプル生成はオフラインで実行され、結果は再利用されます。したがって、拡張では、元のVAOアルゴリズムと比較して追加の制限はありません。

42.

Table 1:さまざまな最適化で効果を計算するのに費やされた時間。パーセンテージは、非加速化VAOに関する実行時間比です。最速の設定が太字で示されています。 Table 2:図15のシーンにおけるUnity SSAOの実装とVAO++の最高の結果との比較。どちらのアルゴリズムも、各品質レベルごとに異なるサンプル数を使用しています。

43.

図15: サンプル数を増やした際のUnity SSAO（上）とVAO++（下）の比較。Unity SSAOでは、 VAO++ 2,4,8および16サンプルに対して3,6,10,16サンプルを使用した。

44.

図16: レイトレーシングのリファレンス画像とVAO++の比較。左から右：レイトレースAOシベニク、VAO++シベニク、レイトレースAO会議室、VAO++会議室

45.

図17: （左）VAO ++で描画されたテストシーン（Viking Village、Corridor、Sibenik and Sponza）のスナップショット、（中央）VAO ++ビジュアライゼーション、（右）Unityの組み込みSSAOビジュアリゼーション。

46.

7. Conclusion • 我々は以前に提案されたVAOアルゴリズム[SKUT10]を拡張し、その性能と視覚的品質を改善するいくつかの最適化を含むVAO++法を説明した。これらの最適化には、適応サンプリング、カリングプリパス、輝度感度、深度範囲チェック、コンパクトサンプルセットによる効率的なインターリーブサンプリングが含まれます。 Unityゲームエンジン内でのメソッドの実装については、メソッドをレンダリングエンジンに組み込む2つの異なる方法を含めて説明しました。 • 提案法を速度と視覚的品質の観点から評価しました。その結果は、 SSAOの標準的なUnity実装と同じ品質を維持しながら、レンダリング時間を最大30％短縮しました。将来は、可変サンプリング密度のカーネルとマルチスケールデプスバッファ表現を使用してサンプルセットをさらに最適化することで、この方法を拡張する予定です。

imagire

関連スライド

PIXの使い方(2022年版)

同人ゲーム開発におけるゲームエンジンの現状

CG概論_CG学習向けの高校数学+α

SGGXマイクロフレーク分布

単位正方形の射影変換の変換係数

心理的安全性って結局何なんだろう

各ページのテキスト