2018-09-20
全新 TU102 繪圖核心
GALAX GeForce RTX 2080 Ti 登場
文: John Lam / 評測中心


NVIDIA 正式發佈新一代「Turing」GPU 微架構旗艦級繪圖卡「GeForce RTX 2080 Ti」,它是近十多年來 GPU 最大的架構躍進,基於全新 12nm FFN 制程的「TU102」繪圖核心,高達 186 億個電晶體、內建 4,352 個 CUDA Cores,首次加入 Tensor Core 及 RT Core 運算單元,帶來革命性 AI 運算及光射追踪渲染,不僅性能表現進一步提升,更將 PC 遊戲畫質帶進另一個層次。



全新「Turing」GPU微架構

 

NVIDIA 正式發佈基於全新「Turing」GPU 微架構的旗艦級遊戲繪圖卡、核心代號為「TU102」的「GeForce RTX 2080 Ti」,它是近十多年來 GPU 最大的架構躍進,包括新增 Tensor 核心、RT 核心及許多新的進階著色功能,透過全新硬體加速引擎及混合渲染技術,能實時提供光線追踪渲染,提供更逼真的物體陰影、反射及折射效果,除了性能表現進一步提升外,更將 PC 遊戲真實感帶進另一個層次。

 

Turing

 

與 NVIDIA「Turing」GPU 微架構開發並行,Microsoft 在 2018 年初宣佈全新 A.I 人工智能及 DXR 光線追踪的 DirectML API,令遊戲開發人員可以快速部署 A.I 人工智能技術與光線追踪於新遊戲中,融合光柵化、實時光線追踪、人工智能和模擬,在 PC 遊戲中實現令人難以置信的真實感,神奇網絡提供驚人的新效果、電影級交互式體驗和流暢創建或導航複雜 3D 模型的交互性。

 

Turing

 

此外,全新「Turing」GPU 還承繼了「Volta」微架構中所有增強的「CUDA」功能,例如獨立線程調度、針對多個 CUDA 應用的地址空間隔離 MPS 硬體加速能力以及全新的協作加速,令新一代 GeForce RTX 繪圖卡的「CUDA」運算能力更靈活、性能更強大。

 

 

 

12nm FinFET 制程、TU102 繪圖核心

 

NVIDIA 「Turing」 GPU 架構相較上代「Pascal」更為複雜,上代「GP102」繪圖核心採用 16nm 制程、內建 120 億個電晶體,Die Size 為 471mm² 、 TDP 為 250W;全新「TU102」繪圖核心增至 186 億個電晶體,受惠於全新TSMC 12nm FFN 制程配合 VLSI 超大型積體電路優化,雖然 Die Size 增至 754mm²,運算單元數目大幅提升,但 TDP 仍保持為 250~260W 水平,性能功耗表現更上一層樓。

 

Turing

NVIDIA TU102 繪圖核心

 

全新「GeForce RTX 2080 Ti」繪圖卡除了在 CUDA Cores 數目上提升至 4,352 個外,同時改用全新 Stream Multi-Processor 架構,相較上代「Pascal」每個 CUDA Core 性能最高可提升 50%,今代更新增了 544 個 Tensor Cores 及 68 個 RT Cores,其中 Tensor Cores 是專門用於執行向量及矩陣運算的專用執行單元,RT Core 則可用於實時光線追踪運算上,無論 3D 運算、A.I 智能運算及光線追踪運算上均有突破性發展。

 

Turing

 

此外,NVIDIA「TU102」繪圖核心新增了多種進階陰影技術,包括 Mesh Shading 網狀陰影、VRS 可變速率陰影及 Texture-Space 空間紋理著色陰影,同時對視點偏移應用加入全新 MVR 多視點圖形渲染技術。全新 NVIDIA RTX 系列首次加入 DNN 深度學習的神經網絡運算,包括超高品質 NGX DLSS ( 深度學習超級採樣)、AI InPainting 內容識別圖像替換、AI Slow-Mo 非常高品質和平滑慢動作,以及 AI Super Rez 智能分辨率調整大小,為 PC 遊戲世界帶來革命性突破。

 

GeForce GTX 1080 Ti vs GeForce RTX 2080 Ti

 GeForce GTX 1080 TiGeForce RTX 2080 Ti
ArchitecturePascalTuring
Manufacturing ProcessTSMC 16nmTSMC 12nm FFN
Transistor Count12 Billion18.6 Billion
Die Size471mm²754mm²
GPCs66
TPCs2834
SMs2868
CUDA per SM12864
Total CUDA Cores35844352
Tensor Cores per SM -8
Total Tensor Cores -544
RT Cores -68
Base Clock1,480MHz

1,350MHz / 1,350MHz*

 

Boost Clock1,582MHz1,545MHz / 1,635MHz*
RTX-OPS (Tera-OPS)11.376 / 78*
Rays Cast (Giga Rays/s)1.110 / 10*
Peak FP32 TFLOPS 11.313.4 / 14.2*
Peak INT32 TIPS -13.4 / 14.2
Peak FP16 TFLOPS -26.9 / 28.5*

Peak FP16 Tensor TFLOPS 

with FP16 Accumulate

 -107.6 / 113.8*

Peak FP16 Tensor TFLOPS

with FP32 Accumulate

 -53.8 / 56.9*
Peak INT8 Tensor TOPS -215.2 / 227.7*
Peak INT4 Tensor TOPS -430.3 / 455.4*
Memory TypeGDDR5XGDDR6
Memory Size11GB11GB
Memory Interface352bit352bit
Memory Clock11Gbps14Gbps
Memory Bandwidth484616
ROPs8888
Texture Units224272
Texture Fill-rate354.4420.2
L2 Cache2816KB5632KB
Register File Size7168KB17408KB
TDP ^250W250W / 260W*

 

#. 所有 TFLOPS、TIPS 及 TOPS 速度基於GPU Boost Clock

*. GeForce RTX 2080 Ti Founders Edition 規格

^. 數字僅代表繪圖卡 TDP,如使用 VirtualLink /USB Type-C 連接需額外增加 35W 功率

發表評論