NVIDIA 1 日正式發佈第二款效能級「Ampere」GPU 產品、核心代號為「GA104-200」的「GeForce RTX 3060 Ti」,號稱是可以幹掉上代 RTX 20 高階 GeForce RTX 2080 SUPER 型號,採用 NVIDIA 的第二代 RTX 架構 Ampere,配備更多的CUDA Cores、更快速的第二代 RT Cores光線追蹤核心、更快速的第三代 Tensor 核心,以 US$399 定價提供了令人難以置信的性能與功能。
NVIDIA GeForce RTX 3060 Ti 新卡登場
▲ GeForce RTX 3060 Ti 正式登場
NVIDIA 1 日正式發佈第二款效能級「Ampere」GPU 產品、核心代號為「GA104-200」的「GeForce RTX 3060 Ti」,號稱是可以幹掉上代 RTX 20 高階 GeForce RTX 2080 SUPER 型號,採用 NVIDIA 的第二代 RTX 架構 Ampere,配備更多的CUDA Cores、更快速的第二代 RT Cores光線追蹤核心、更快速的第三代 Tensor 核心,以 US$399 定價提供了令人難以置信的性能與功能。
▲ NVIDIA 官方提供的 RTX 3060 Ti 性能對比
據 NVIDIA 指出,「GeForce RTX 3060 Ti」提供 16 FP32 TFLOPs 、32 RT TFLOPs 及 130 Tensor TFLOPs 運算能力,性能與 GeForce RTX 2080 Ti 相約或更快,但價錢便直一半,相較上代同價位 GeForce RTX 2060 Super 快 1.4 倍,效能級開 Full-HD / 2K 光追順暢玩遊戲不再是夢。
8nm 制程、GA104-200 繪圖核心
有別於旗艦型號 GeForce RTX 3080、RTX 3090 採用「GA102」繪圖核心,效能級的「GeForce RTX 3060 Ti」是採用規模較細的「GA104」繪圖核心,相較上代 「TU104」的性能差異主要來自FP32 運算單元提升了 1 倍、升級第 2 代 RT Cores、升級第 3 代 Tensor Cores,令傳統光柵圖形運算提高了 1.7 倍,同時在光線追踪性能上提升近 2 倍。
「GeForce RTX 3060 Ti」採用「GA104-200」繪圖核心,採用 8nm NVIDIA Custom 制程、SAMSUNG 代工,擁有 174 億個電晶體、Die Size 約為 392mm²,完整的 GA104 晶片內建 6 個 GPC 單元、24個 TPC 紋理處理群集及 48 個 SM 串流多處理器,增至 6,144 個 CUDA Cores、48 個 RT Cores 及 192 個 Tensor Cores。
▲ NVIDIA GA104-200-A1 繪圖核心
不過,「GeForce RTX 3060 Ti」部份單元作出了屏蔽,被刪減至 5 個 GPC 單元,只有 19 個 TPC 紋理處理群集,只擁有 38 個 SM 串流多處理器,具備 4,864 個 CUDA Cores、38 個 RT Cores 及 152個 Tensor Cores。
核心時脈方面,GeForce RTX 3060 Ti 預設時脈為 1,410MHz Base Clock、1,665 MHz Boost Clock,最高 TDP 為 200W。此外,「GeForce RTX 3060 Ti」仍然沿用 GDDR6 記憶體顆粒、8GB 記憶體容量,記憶體時脈為1,750MHz,傳輸速度卻高達 14Gbps,具備 256 bit 記憶體頻寬介面、總頻寬為 448GB/s。
NVIDIA GeForce RTX 30 Family
Graphics Card | GeForce RTX 3060 Ti Founders Edition | GeForce RTX 3070 Founders Edition | GeForce RTX 3080 Founders Edition | GeForce RTX 3090 Founders Edition |
GPU Codename | GA104 | GA104 | GA102 | GA102 |
GPU Architecture | NVIDIA Ampere | NVIDIA Ampere | NVIDIA Ampere | NVIDIA Ampere |
GPCs | 5 | 6 | 6 | 7 |
TPCs | 19 | 23 | 34 | 41 |
SMs | 38 | 46 | 68 | 82 |
CUDA Cores / SM | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 4864 | 5888 | 8704 | 10496 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (3rd Gen) |
Tensor Cores / GPU | 152 (3rd Gen) | 184 (3rd Gen) | 272 (3rd Gen) | 328 (3rd Gen) |
RT Cores | 38 (2nd Gen) | 46 (2nd Gen) | 68 (2nd Gen) | 82 (2nd Gen) |
GPU Boost Clock (MHz) | 1665 | 1725 | 1710 | 1695 |
Frame Buffer Memory Size and Type | 8192 MB GDDR6 | 8192 MB GDDR6 | 10240 MB GDDR6X | 24576 MB GDDR6X |
Memory Interface | 256-bit | 256-bit | 320-bit | 384-bit |
Memory Clock (Data Rate) | 14 Gbps | 14 Gbps | 19 Gbps | 19.5 Gbps |
Memory Bandwidth | 448 GB/sec | 448 GB/sec | 760 GB/sec | 936 GB/sec |
ROPs | 80 | 96 | 96 | 112 |
L1 Data Cache/Shared Memory | 4868 KB | 5888 KB | 8704 KB | 10496 KB |
L2 Cache Size | 4096 KB | 4096 KB | 5120 KB | 6144 KB |
TGP (Total Graphics Power) | 200 Watts | 220 Watts | 320 Watts | 350 Watts |
Transistor Count | 17.4 Billion | 17.4 Billion | 28.3 Billion | 28.3 Billion |
Die Size | 392.5 mm2 | 392.5 mm2 | 628.4 mm2 | 628.4 mm2 |
Price | US$399 | US$499 | US$699 | US$1499 |