2020-10-29
全新 GA104-300 繪圖核心 !!
GIGABYTE GeForce RTX 3070 Gaming OC
文: John Lam / 評測中心


NVIDIA 正式發佈全新效能級「GeForce RTX 3070」繪圖卡,採用全新「GA104-300」繪圖核心,升級新一代 Ampere GPU 微架構、具備 5,888 個 CUDA Cores、46 個 RT Cores 及 184 個第 3 代 Tesnsor Cores 與8GB GDDR6 記憶體,性能媲美上代 US$999 旗艦級 RTX 2080 Ti,但 RTX 3070 售價卻只需 US$499,開 2K 光追順暢打機不是夢,編輯部找來 GIGABYTE GeForce RTX 3070 Gaming OC 進行測試。



NVIDIA GeForce RTX 3070 新卡登場

 

 

NVIDIA GeForce RTX 3070

▲ GeForce RTX 3070 正式登場

 

 

NVIDIA 17 日正式發佈首款效能級「Ampere」GPU 產品、核心代號為「GA104」的「GeForce RTX 3070」,號稱是可以幹掉上代 RTX 20 旗艦級型號,採用 NVIDIA 的第二代 RTX 架構 Ampere,配備更多的CUDA Cores、更快速的第二代 RT Cores光線追蹤核心、更快速的第三代 Tensor 核心,以 US$499 定價提供了令人難以置信的性能與功能。

 

 

NVIDIA GeForce RTX 3070

▲ NVIDIA 官方提供的 RTX 3070 性能對比

 

 

據 NVIDIA 指出,「GeForce RTX 3070」提供 20.31 FP32 TFLOPs 、39.7 RT TFLOPs 及 162.6 Tensor TFLOPs 運算能力,性能與 GeForce RTX 2080 Ti 相約或更快,但價錢便直一半,相較上代同價位 GeForce RTX 2070 快 1.6 倍,效能級開 2K 光追順暢玩遊戲不再是夢。

 

 

 

SAMSUNG 8nm 制程、 NVIDIA GA104 繪圖核心

 

有別於旗艦型號 GeForce RTX 3080、RTX 3090 採用「GA102」繪圖核心,效能級的「GeForce RTX 3070」是採用規模較細的「GA104」繪圖核心,相較上代 「TU104」的性能差異主要來自FP32 運算單元提升了 1 倍、升級第 2 代 RT Cores、升級第 3 代 Tensor Cores,令傳統光柵圖形運算提高了 1.7 倍,同時在光線追踪性能上提升近 2 倍。

 

 

NVIDIA GeForce RTX 3070

▲ NVIDIA GA104-300 Block Diagram

 

 

「GeForce RTX 3070」採用「GA104-300」繪圖核心,採用 8nm NVIDIA Custom 制程、SAMSUNG 代工,擁有 174 億個電晶體、Die Size 約為 392mm²,完整的 GA104 晶片內建 6 個 GPC 單元、24個 TPC 紋理處理群集及 48 個 SM 串流多處理器,增至 6,144 個 CUDA Cores、48 個 RT Cores 及 192 個 Tensor Cores。

 

 

3070

▲ NVIDIA GA104-300-A1 繪圖核心

 

 

不過,「GeForce RTX 3070」部份單元作出了屏蔽,同樣擁有 6 個 GPC 單元,但刪走了 1 個 TPC 紋理處理群集,只擁有 46 個 SM 串流多處理器,具備 5,888 個 CUDA Cores、46 個 RT Cores 及 184個 Tensor Cores。

 

14

 

 

Graphics CardGeForce RTX 3070 Founders EditionGeForce RTX 3080 10 GB Founders EditionGeForce RTX 3090 Founders Edition
GPU CodenameGA104GA102GA102
GPU ArchitectureNVIDIA AmpereNVIDIA AmpereNVIDIA Ampere
GPCs667
TPCs233441
SMs466882
CUDA Cores / SM128128128
CUDA Cores / GPU5888870410496
Tensor Cores / SM4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)
Tensor Cores / GPU184 (3rd Gen)272 (3rd Gen)328 (3rd Gen)
RT Cores46 (2nd Gen)68 (2nd Gen)82 (2nd Gen)
GPU Boost Clock (MHz)172517101695
Peak FP32 TFLOPS (non-Tensor)120.329.835.6
Peak FP16 TFLOPS (non-Tensor)120.329.835.6
Peak BF16 TFLOPS (non-Tensor)120.329.835.6
Peak INT32 TOPS (non-Tensor)1,310.214.917.8
Peak FP16 Tensor TFLOPS with FP16 Accumulate181.3/162.62119/2382142/2842
Peak FP16 Tensor TFLOPS with FP32 Accumulate140.6/81.3259.5/119271/1422
Peak BF16 Tensor TFLOPS with FP32 Accumulate140.6/81.3259.5/119271/1422
Peak TF32 Tensor TFLOPS120.3/40.6229.8/59.5235.6/712
Peak INT8 Tensor TOPS1162.6/325.22238/4762284/5682
Peak INT4 Tensor TOPS1325.2/650.42476/9522568/11362
Frame Buffer Memory Size and Type8192 MB GDDR610240 MB GDDR6X24576 MB GDDR6X
Memory Interface256-bit320-bit384-bit
Memory Clock (Data Rate)14 Gbps19 Gbps19.5 Gbps
Memory Bandwidth448 GB/sec760 GB/sec936 GB/sec
ROPs9696112
Pixel Fill-rate (Gigapixels/sec)165.6164.2193
Texture Units184272328
Texel Fill-rate (Gigatexels/sec)317.4465566
L1 Data Cache/Shared Memory5888 KB8704 KB10496 KB
L2 Cache Size4096 KB5120 KB6144 KB
Register File Size11776 KB17408 KB20992 KB
TGP (Total Graphics Power)220 Watts320 Watts350 Watts
Transistor Count17.4 Billion28.3 Billion28.3 Billion
Die Size392.5 mm2628.4 mm2628.4 mm2
發表評論