2021-06-09
完壁 GA104、升級 GDDR6X
NVIDIA GeForce RTX 3070 Ti FE 顯示卡
文: John Lam / 評測中心


NVIDIA 發佈全新 GeForce RTX 3070 Ti 顯示卡,採用完整 GA104 繪圖核心、增至 6,144 個 CUDA Cores,換上速度更快的 8GB GDDR6X 記憶體,在 256bit 記憶體介面頻寬下增至 608GB/s,官方定價 US$599 定位 2K 遊戲光追特效全開、4K 遊戲性能合格有餘,由於 NVIDIA 限制 RTX 3070 Ti 的挖礦性能,令售價有望變得較平易近人,編輯部今次找來 RTX 3070 / RTX 3080 與 RTX 3070 Ti 進行實測對比。



2K 光追特效全開、GeForce RTX 3070 Ti 新卡登場

 

RTX 3070 Ti

 

 

緊接 RTX 3080 Ti,NVIDIA 9 日正式發佈全新 GeForce RTX 3070 Ti 顯示卡,這張卡原定於 2 月底上市,SKU 規格亦曾作出更改,由於對位的 AMD Radeon RX 6800 完全沒有造成威脅 ,由最初 GA102-150 繪圖核心,最後改為完壁的 GA104-400 繪圖核心,CUDA Core 數目進一步提升至 6,144 個,同時換上更高速的 8GB GDDR6X 記憶體,能滿足 2K 遊戲光追特效全開、4K 遊戲性能合格有餘 ,官方 MSRP 定價 US$599、定位 2K 效能級遊戲玩家市場。

RTX 3070 Ti

 

由於 ETH 挖礦已嚴重至影響整個 PC 及 Gaming 行業生態,NVIDIA 正計劃擴大打壓 ETH 挖礦,NVIDIA GeForce RTX 3070 Ti 已在 GPU 底層中加入 ETH 偵測機制,令 RTX 3070 Ti 挖礦下降一半,Dagger Hashi-Motto 算法大約只有 35~38 MH/s,算力 RTX 3060 Ti 的 6 成實力,還輸給破功後的 RTX 3060 Ti ,而且更食電、Efficiency 低得可怕,相信礦工們對這張 RTX 3070 Ti 興趣不大。

 

 

 

完壁的 GA104-400 繪圖核心

 

 

RTX 3070 Ti

▲ NVIDIA GA104-400 Block Diagram

 

 

GeForce RTX 3070 Ti 採用 GA104-400 繪圖核心,是一顆完整的 GA104 晶片,採用 8nm NVIDIA Custom 制程、SAMSUNG 代工,擁有 174 億個電晶體、Die Size 約為 392mm²,完整的 GA104 晶片內建 6 個 GPC 單元、24個 TPC 紋理處理群集及 48 個 SM 串流多處理器,增至 6,144 個 CUDA Cores、48 個 RT Cores 及 192 個 Tensor Cores。

 

 

RTX 3070 Ti

▲ NVIDIA GA104-400-A1 繪圖核心

 

 

核心時脈方面,GeForce RTX 3070 Ti 預設時脈為 1,575MHz Base Clock、1,770 MHz Boost Clock,最高 TDP 為 290W,換上 GDDR6X 記憶體顆粒,記憶體介面雖然保持 256bit 與 RTX 3070 一樣,但記憶體速度由 14Gbps 提升至 19Gbps,令記憶體頻寬由 448GB/s 提升 608GB/s,對於處理光線追踪和特效性能有明顯改善。

 

 

 

GDDR6 vs GDDR6X 的差異

 

記憶體子系統對遊戲性能非常重要,GeForce RTX 3070 Ti  特別改用 GDDR6X 記憶體顆粒,以滿足功能更強大的著色器與更加複雜的渲染技術,它並不是單純提高晶片時脈而是透過全新的 4-Level PAM4 四級脈衝訊號,透過多級訊令技術可以在單一週期傳輸約 2 筆資料,相較舊有 GDDR6 採用的 2-Level NRZ 技術,在同時脈下頻寬提升 1 倍。

 

 

GDDR6X

 

 

圖上顯示了 GDDR6 (左) 與 GDDR6X (右) 之間的訊號眼形比較,PAM4 並不是直接傳輸兩位 2 進制訊號,而是使用了 4個不同的電壓水平,每個電壓電平相差 250mV,每個電平代表著 2 個數據位,透過電壓差提供 00、01、10 或 11 數據。

 

GDDR6X

 

 

為了解決 PAM4 技術的 SNR 訊噪問題,GDDR6X 提供了全新 MTA 編碼方案MTA,防止訊號從最高電平轉換到最低電平,反之亦然,從而提高了接口 SNR 。這是通過使每個引腳的一部分數據脈衝串在編碼引腳上傳輸的字節中的一部分(時間交織),然後使用明智選擇的代碼字將數據脈衝串的其餘部分映射到一個沒有最大躍遷的序列來實現的。最後,封裝和 PCB 設計均需要重新設計,並進行全面的信號和電源完整性分析,以實現更高的數據速度。

 

 

NVIDIA GeForce RTX 30 Family

Graphics CardGeForce
RTX
3060
GeForce
RTX
3060 Ti
GeForce
RTX
3070
GeForce
RTX
3070 Ti
GeForce
RTX
3080
GeForce
RTX
3080 Ti
GeForce
RTX
3090
GPU CodenameGA106GA104GA104GA104GA102GA102GA102
GPU ArchitectureAmpereAmpereAmpereAmpereAmpereAmpereAmpere
GPCs3566677
TPCs14192324344041
SMs28384648688082
CUDA Cores / SM128128128128128128128
CUDA Cores / GPU358448645888614487041024010496
Tensor Cores / SM4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)4 (3rd Gen)
Tensor Cores / GPU112 (3rd Gen)152 (3rd Gen)184 (3rd Gen)192 (3rd Gen)272 (3rd Gen)320 (3rd Gen)328 (3rd Gen)
RT Cores28 (2nd Gen)38 (2nd Gen)46 (2nd Gen)48 (2nd Gen)68 (2nd Gen)80 (2nd Gen)82 (2nd Gen)
GPU Boost Clock (MHz)1777166517251770171016651695
Frame Buffer Memory Size and Type12228 MB
GDDR6
8192 MB
GDDR6

8192 MB

GDDR6

8192 MB
GDDR6X

10240 MB

GDDR6X

12228 MB
GDDR6X
24576 MB
GDDR6X
Memory Interface192-bit256-bit256-bit256-bit320-bit384-bit384-bit
Memory Clock (Data Rate)15 Gbps14 Gbps14 Gbps19 Gbps19 Gbps19 Gbps19.5 Gbps
Memory Bandwidth360 GB/sec448 GB/sec448 GB/sec608 GB/sec760 GB/sec912 GB/sec936 GB/sec
ROPs48809696112112
L1 Data Cache/Shared Memory3584 KB4868 KB5888 KB6144 KB8704 KB10496 KB10496 KB
L2 Cache Size3072 KB4096 KB4096 KB4096 KB5120 KB6144 KB6144 KB
TGP (Total Graphics Power)170 Watts200 Watts220 Watts290 Watts320 Watts350 Watts350 Watts
Transistor Count13.3 Billion17.4 Billion17.4 Billion17.4 Billion28.3 Billion28.3 Billion28.3 Billion
Die Size276.0 mm2392.5 mm2392.5 mm2392.5 mm2628.4 mm2628.4 mm2628.4 mm2
PriceUS$329US$399US$499US$599US$699US$1199US$1499
分享到:
發表評論