NVIDIA 推出新一代「Turing」GPU 微架構效能級繪圖卡「GeForce RTX 2060」,採用全新 12nm 制程的「TU106-200」繪圖核心,內建 1,920 個 CUDA Cores、120 Texture Units,更擁有 240 個 Tesnor Cores 及 30 個 RT Cores,滿足 1080p / 1440p 解析度流暢執行光射追踪技術,性能相較上代「GeForce GTX 1060」明顯提升,官方定價約 US$349 。
NVIDIA GeForce RTX 2060 登場
緊接效能級的「GeForce RTX 2070」之外,NVIDIA 再發佈全新主流級的「GeForce RTX 2060」,同樣基於全新 NVIDIA「Turing」GPU微架構,它是十多年來 GPU 最大的架構躍進,包括新增 Tensor 核心、RT 核心及許多新的進階著色功能,透過全新硬體加速引擎及混合渲染技術,能實時提供光線追踪渲染,提供更逼真的物體陰影、反射及折射效果,除了性能相較上代更進一步外,同時將 PC 遊戲真實感帶進另一個層次。
全新「Turing」GPU微架構支援 A.I 人工智能及 DXR 光線追踪的 DirectML API,令遊戲開發人員可以快速部署 A.I 人工智能技術與光線追踪於新遊戲中,融合光柵化、實時光線追踪、人工智能和模擬,在 PC 遊戲中實現令人難以置信的真實感,神經網絡提供驚人的新效果、電影級交互式體驗和流暢創建或導航複雜 3D 模型的交互性。
此外,全新「Turing」GPU 還承繼了「Volta」微架構中所有增強的「CUDA」功能,例如獨立線程調度、針對多個 CUDA 應用的地址空間隔離 MPS 硬體加速能力以及全新的協作加速,令新一代 GeForce RTX 繪圖卡的「CUDA」運算能力更靈活、性能更強大。
NVIDIA TU106-200 繪圖核心
全新「GeForce RTX 2060」與「GeForce RTX 2070」同樣基於全新「TU106」繪圖核心,透過屏蔽運算單元來劃分市場區間,內建 108 億個電晶體、Die Size 約為 445 mm²,同樣內建 3 個 GPC 圖形處理群,但縮減 15 個 TPC 紋理處理群集及 30 個 SM 串流多處理器,合共1,920 個 CUDA Core及 120 個 Texture Unit。
每個 GPC 內擁有一組獨立的 Raster Engine 光柵處理引擎及 5 個 TPC 紋理處理群集,每個 TPC 群集包含 2 個 SM 模組,每個 SM 內建 64 個 CUDA Cores、8 個 Tensor Cores、1 個 RT Cores、256KB Register File 及 4 個 Texture Units,並擁有 96KB L1 Cache/Shared Memory 可因應運算或圖形工作負載作出可改變的配置。
每個 SM 單元具備兩個 FP64 運算單元,總數合共 96 個 FP64 運算單元,但圖中並沒有標示出來,它的作用是確保 FP64 代碼的程式可以正常運作,但並非主要的硬體運算單元。
內建 6 個 32 bit GDDR6 記憶體控制器、總共 192bit 記憶體頻寬,每個記憶體控制器綁定 8 個 ROP 單元及 512KB L2 Cache,合共擁有 48 個 ROP 單元及 3,072KB L2 Cache。
GeForce GTX 1070/1060 vs GeForce RTX 2070/2060
GeForce GTX 1070 | GeForce RTX 2070 | GeForce GTX 1060 | GeForce RTX 2060 | |
Architecture | Pascal | Turing | Pascal | Turing |
Manufacturing Process | TSMC 16nm | TSMC 12nm FFN | TSMC 16nm | TSMC 12nm FFN |
Transistor Count | 7.2 Billion | 10.8 Billion | 4.4 Billion | 10.8 Billion |
Die Size | 314mm² | 445mm² | 200mm² | 445mm² |
GPCs | 3 | 3 | 2 | 3 |
TPCs | 15 | 18 | 10 | 15 |
SMs | 15 | 36 | 10 | 30 |
CUDA per SM | 128 | 64 | 128 | 64 |
Total CUDA Cores | 1920 | 2304 | 1280 | 1920 |
Tensor Cores per SM | - | 8 | - | 8 |
Total Tensor Cores | - | 288 | - | 240 |
RT Cores | - | 36 | - | 30 |
Base Clock | 1,506MHz | 1,410MHz / 1,410MHz* | 1,506MHz | 1,365MHz |
Boost Clock | 1,683MHz | 1,620MHz / 1,710MHz* | 1,708MHz | 1,680MHz |
Memory Type | GDDR5 | GDDR6 | GDDR5 | GDDR6 |
Memory Size | 8GB | 8GB | 6GB | 6GB |
Memory Interface | 256bit | 256bit | 192bit | 192bit |
Memory Clock | 8Gbps | 14Gbps | 8Gbps | 14Gbps |
Memory Bandwidth | 256 | 448 | 192 | 336.1 |
ROPs | 64 | 64 | 48 | 48 |
Texture Units | 120 | 144 | 80 | 120 |
L2 Cache | 2048KB | 4096KB | 1536KB | 3072KB |
TDP ^ | 150W | 175W / 185W* | 120W | 160W* |
*. Founders Edition 規格
^. 數字僅代表繪圖卡 TDP,如使用 VirtualLink /USB Type-C 連接需額外增加 35W 功率