GeForce RTX 20 シリーズ グラフィックス カード – NVIDIA GeForce発表!(後編)

Pocket
LINEで送る

Figure 2. Turing TU102 Full GPU with 72 SM Units

引き続き、8月20日に発表されたGeForce RTX 20シリーズについて、書いていきたいと思います。

前回「GeForce RTX 20 シリーズ グラフィックス カード – NVIDIA GeForce発表!(前編)」では、GeForce RTX 20の目玉機能の一つ、レイトレーシングについて説明しました。

「そもそもレイトレーシングとは何ぞ?」という方は、下記の記事をご覧ください。

GeForce RTX 20 シリーズ グラフィックス カード – NVIDIA GeForce発表!(前編)

 

今回(後編)では、もう一つの目玉機能、

  • DLSSのアンチエイリアシング

について書いて行きたいと思います。

 

DLSSとは、Deep Learning Super Samplingの略ですが、この機能について説明する前に、RTXから採用されたTuringアーキテクチャのコア構成からみていきたいと思います。

スクリーンショット 2018-09-17 19.19.00

NVIDIA Turing Architecture In-Depthより一部抜粋

Turingアーキテクチャが採用されているRTX 2080 Ti をみてみましょう。

まず68個のSM(Streaming Multiprocessorの略でGPU演算機の集まりをNVIDIAではSMと呼んでいる)があり、さらに1つのSMあたりの構成をみると、

CUDAコア:64基 ※参考:CUDA(Compute Unified Device Architecture)

Tensorコア:8基

RTコア:1基

となっているようです。

Pascalアーキテクチャに比べ、SM辺りのCUDAコア数は減っていますが、SM数自体が大幅に増えているのがTurningアーキテクチャの特徴かもしれません。

TensorコアRTコアがTuringアーキテクチャから新たに採用されたコアです。

Figure 4. Turing TU102/TU104/TU106 Streaming Multiprocessor (SM)

NVIDIA Turing Architecture In-Depthより抜粋

各コアの役割をあまり詳しく説明していくと、日が暮れてしまうので、詳細は省きますが、先のレイトレーシングの処理は、CUDAコアとRTコアで行います。

その過程で、RTコアが実は重要な役割を果たしています。

 

RTコアの概要としては、「Ray Triangles Intersection」と書かれていますが、簡単に説明すると「レイが通過するポリゴン検索とその衝突判定処理専門の回路」ということのようです。

処理の流れとしては、CUDAコアがレイを発射し、そのレイに衝突するポリゴンをRTコアが検索。その結果をまたCUDAコアに返えすというフローのようです。

Turing_RTcore_flow

NVIDIA Turing Architecture In-Depthより抜粋

また、RTコアがポリゴンを高速で検索するBVH(Bounding Volume Hierarchy)アルゴリズムについては下記の動画で少し説明されています。

今までのPascalアーキテクチャではこの処理をCUDAコアのみで行っていたため、非常にコストがかかっていたみたいです。

1つのレイの衝突判定で数千の命令を使用してしまっていたと書かれています。

Pascal_flow

NVIDIA Turing Architecture In-Depthより抜粋

このTuringアーキテクチャにより、RTX 2080 Tiでは、(68基のRTコアで)毎秒10Giga Rays以上の処理ができるようです。

GTX 1080 Tiでは、毎秒1.1Giga Raysだったので、つまり、「RTX 2080Tiは、GTX 1080Tiの約10倍の性能」ということらしいです。

ただそれでも、単純にレイを飛ばしてのリアルタイムレイトレーシングはまだ難しいようです。

例えばですが、レイトレーシングではレイを飛ばしてピクセルの色を判定していきますが、レイの数が少ないと、下記のイメージのようにノイズがのったような画像になります。

スクリーンショット 2018-09-17 21.32.19

これにさらに時間をかけて、より多くのレイと飛ばして処理することで、リアルな画像を生成していきます。

スクリーンショット 2018-09-17 21.34.04

※参考:https://www.chaosgroup.com/blog/experiments-with-v-ray-next-using-the-nvidia-optix-denoiser

ただ、ゲームのようにリアルタイム描画が必要な場合、時間をかけていられません。

そのため考えられたやり方が、レイを飛ばして綺麗にするのではなく、ノイズを取り除く処理、デノイズ(Denoise)という画像処理を行うことで、大幅に時間を短縮させよう!というものです。

ここでTensorコア登場します。Tensorコアは、そういった画層処理を専門に行うコアなのですが、Turingアーキテクチャ向けにNVIDIAが提供することになったAPI、NGX(Neural Graphics Acceleration)を使用することで様々な画像処理を行えるようになっています。

nvidia_ngx_1

※参考:https://www.purepc.pl/minirecenzje/nvidia_geforce_rtx_2070_2080_i_2080_ti_architektura_i_specyfikacja

このNGX APIは、ディープ・ニューラル・ネットワーク(DNN)を組み込んだAI系処理を行うものです。NVIDIAのスーパーコンピュータで予め学習済のデータを使用して画像処理を行う事ができます。

NGXの詳細については、下記を御覧ください。

NVIDIA NGX Technology – AI for Visual Applications

Tensorコアは、このNGX API経由で画像処理を行う専用のコアになります。

先のノイジーな画像のデノイズをTensorコアが行います。そうすることで、レイを飛ばして画像を完成させるよりも大幅に時間を短縮することができたようです。

ここで、やっと、DLSSのアンチエイリアシングの話しに戻ります。

DLSS(Deep Learning Super Sampling)は、NGX APIの機能の一つです。

ざっくりDLSSについて説明すると、予め潤沢なリソース(NVIDIAのスーパーコンピューター)上で作成されたゲームのレンダリング結果と従来の方法(グラボのGPU上)で作成されるレンダリング結果とを突き合わせ、ベストなアンチエイリアスのかけ方をNVIDIAのスーパーコンピューター上で学習させて作成された学習データを使い(NGX経由で)、Tensorコアがアンチエイリアス処理を行うということです。

ですので、ゲーム上でこのDLSSアンチエイリアシングを使用するためには、アプリが対応していなければなりません。

デベロッパー側は予め超高解像度でレンダリングした画像をアップロードしてディープラーニングさせておきます。そうすることで、環境が整っているユーザーはアプリ使用時に、自動でNGX経由で、予め作成されたAIモデルをDLSSとして使用できるようになります。

image20

NVIDIA Turing Architecture In-Depthより抜粋

GeForce RTX 20シリーズ発表イベントの動画では、下記より解説されています。

Deep Learningを使ったAI的なアプローチをレンダリング処理に組み込むという話で、高画質化に必要なサンプリンス数を減らし今までより高速にかつ綺麗に表示できるようになる!という技術です。

このDSLLにより、4K&HDR&60fpsのゲームプレイが余裕だぜっ!( ・`ω・´)キリッ
というのをアピールしてます。

DSLLアンチエイジング(NGX API)は、レイトレーシングとは切り離して使えるものなので、レイトレーシングよりも先にDSLLに対応したアプリがリリースされるのではないかと予想されます。(RTXの価値はレイトレーシングだけじゃないぜ!というアピールですね。)

で、DLSS対応を表明したゲームタイトル(9月14日時点)が、下記になります。

  • Ark: Survival Evolved
  • Atomic Heart
  • Darksiders III
  • Dauntless
  • Deliver Us The Moon: Fortuna
  • Fear The Wolves
  • Final Fantasy XV: Windows Edition
  • Fractured Lands
  • Hellblade: Senua’s Sacrifice
  • Hitman 2
  • Islands of Nyne
  • JX3
  • Justice
  • KINETIK
  • Mechwarrior 5: Mercenaries
  • Outpost Zero
  • Overkill’s The Walking Dead
  • PLAYERUNKNOWN’S BATTLEGROUNDS
  • Remnant: From The Ashes
  • Serious Sam 4: Planet Badass
  • Shadow of the Tomb Raider
  • Stormdivers
  • The Forge Arena
  • We Happy Few

※参考:https://weekly.ascii.jp/elem/000/000/419/419313/index-4.html

一応、有名どころで、Final Fantasy XVが入っていますね。

という訳で、2回に渡って、GeForce RTX 20 シリーズについて語ってみました。

GeForce RTX 2080 Tiは、9/27に発売が延期されましたが、GeForce RTX 2080 の方は、9/20に発売が開始されています。

気になるGeForce RTX 20シリーズのレビュー下記を参考にしてみてください。

https://www.4gamer.net/games/421/G042134/20180919145/

 

調べてみると、意外と興味深い領域だったりするので、グラフィックカードにそれほど興味がかった方に、ちょっとでも興味を持ってもらえると幸いです。

個人的には、レーシングゲームが好きで、ゲームとしてはForzaとかProject CARS 2とかなんですよね。

実は、NVIDIAのグラボ、いくつか所有しているのですが、ゲームというより、マイニング用で散財していたりします。

 

IMG_0862

 

↑ とりあえず乱雑に作ったやつ

 

IMG_3529

↑ グラボをちょっとカッコよくみせ、かつ、コンパクトなバージョン

この辺のマイニングマシーンについては別の話とさせていただければと思います。
ではまた〜!

Pocket
LINEで送る