2020-07-16
Ray Tracing、DLSS 2.0 遊戲實測
GIGABYTE GeForce RTX 2080 SUPER™ Gaming OC
文: Angus Wong / 評測中心


越來越多遊戲支援 Ray Tracing 技術,用家必需搭配 NVIDIA® GeForce RTX™ 系列的繪圖卡才能享受真實光線效果,而且在性能上難免會付出代價,幸好 NVIDIA® 推出了 DLSS 2.0 技術,在同樣的畫質設置下,開啟 DLSS 後能讓遊戲 FPS 提升最高達 75%,筆者這次借來 GIGABYTE GeForce® RTX 2080 SUPER™ Gaming OC 繪圖,實測 Minecraft 遊戲啟動 GeForce RTX™ 與 DLSS 2.0 後,在遊戲畫質及性能上有何差異。



GeForce RTX™ 與 GeForce® GTX 有何不同 ?

 

RTX ON VS OFF

 

隨著 NVIDIA® 在新一代 GeForce RTX™ 系列繪圖卡上加入實時光線追蹤技術後,XBOX Series X 及 Play Station 5 亦先後宣佈將會支援實時 Ray-Tracing,相信在不久的將來,光線追蹤將會是遊戲的標配。但是在談論實時光線追蹤的效果前,先來重溫一下 NVIDIA® GeForce RTX™ 20 系列繪圖卡比上代多出的兩大單元。

 

RTX ON VS OFF

 

 

 

全新 RT Core 運算單元

 

NVIDIA® GeForce RTX™ 系列繪圖卡中最核心的部分,當然就是新增了負責 Ray Tracing 的 RT Core。在過去的 GPU 架構中,繪圖卡並無法對遊戲及圖形進行複雜的實時光線追蹤處理,NVIDIA® 經過過 10 年的研究及開發,終於在新一代「Turing」GPU 微架構中加入硬體光線追踪加速引擎 —「RT Cores」,結合 NVIDIA® GeForce RTX™ 軟件引擎,實現逼真的實時光線場景效果。

 

TU102

 

全新「Turing」SM 模組內均擁有 1 個 RT Core,提供 BVH 邊界體積層次遍歷及射線三角測試硬體加速運算,從而節省了 SM 模組對每條光線的額外處理。每個 RT Core 內含兩個專用單元,第一個單元進行邊界框架測試,第二個單元進行射線三角交叉測試。

 

「Turing」SM 模組只需啟動射線探測器,RT 核心執行 BVH 遍歷和射線三角測試,並向 SM 返回命中或不命中,SM 可以空置並執行其他圖形或運算工作。

 

TU104

 

受惠於全新 RT Cores 運算單元,全新「Turing」繪圖核心的光線跟踪性能,相較上代「Pascal」繪圖核心有明顯增長,使用「GeForce® GTX 1080」繪圖核心執行軟體光線射踪每秒可達成 0.89 Giga Rays,但使用「GeForce RTX™ 2080」繪圖核心則可達至 8 Giga Rays,支援 NVIDIA® GeForce RTX™、Microsoft DXR 及 Vulkan API,為遊戲和專業應用提供令人難以置信的逼真和物理精確的圖形。

 

 

 

新增 Tensor Core 運算單元

 

NVIDIA® GeForce RTX™ 20 系列繪圖卡採用全新「Turing」GPU 微架構,其中另一特點就是新增了增強型的 Tensor Core 運算單元,這是專門用於執行向量及矩陣運算的運算單元,包括 INT8 及 INT4 精度的函數運算,以及更高精度的 FP16 運算工作,主要用於深度學習神經網絡運算、推理運算、矩陣運算等,提供更佳的硬體加速能力。

TU102

 

針對遊戲應用層面,Tensor Cores 其中一個重點就是加入全新 DLSS 深度學習超級採樣技術,透過深度神經網絡提取渲染場景的多維特徵,並智能地組合來自多個幀的細節,以構建高質量 3D 影像。與傳統的 AA 技術相比,DLSS 使用更少的輸入樣本,同時避免了透明度和其他復雜場景元素的算法難度,下文將會為大家實測全新 DLSS 2.0 技術能夠到底能夠帶來多大的遊戲 FPS 提升。

 

TU102

▲ Pascal 向量核心與 Turing Tensor Core 數目比較 

 

全新「Turing」SM 模組內建 8 個 Tensor Cores,每個 Tensor Core 單一週期可執行 64 個 FMA 浮點融合乘加運算、64 個 FP16 乘法累加運算、128 個 FP16 運算、256 個 INT8 精度運算或 512 個 INT4 精度運算。

 

發表評論