2020-11-03
根本就是「TITAN」嘛 !!
ASUS ROG STRIX GeForce RTX 3090 顯示卡
文: John Lam / 評測中心


NVIDIA 正式發佈全新「GeForce RTX 3090」繪圖卡,它是針對內容創作者以及追求遊戲極端性能的玩家而生,採用全新「GA-102-300」繪圖核心,升級新一代 Ampere GPU 微架構、增至 10,496 個 CUDA Cores、第 2 代 RT Cores 及第 3 代 Tesnsor Cores 與 24GB GDDR6X 記憶體,取代舊有 TITAN RTX 沿有地位,HKEPC 找來 ASUS ROG Strix GeForce RTX 3090 繪圖卡進行評測。



全新 GDDR6X 記憶體控制器

 

GDDR6X
▲ GDDR6X 記憶體顆粒

 

 

記憶體子系統對性能表現絕對是至關重要,因此 Ampere GPU 微架構特別針對記憶體控制器、Cache 緩存設計作出改良,以增加記憶體頻寬及減少讀取延遲,其中一大改進是全新 GDDR6X 記憶體控制器,配合更高的 GDDR6X 記憶體顆粒,以滿足功能更強大的著色器與更加複雜的渲染技術。

 

GeForce RTX 30 系列是首個應用 GDDR6X 技術的 GPU 產品,它並不是單純提供晶片時脈而是透過全新的 4-Level PAM4 四級脈衝訊號,透過多級訊令技術可以在單一週期傳輸 2 筆資料,相較舊有 GDDR6 採用的 2-Level NRZ 技術,在同時脈下頻寬提升 1 倍。

 

 

GDDR6X

 

 

圖上顯示了 GDDR6 (左) 與 GDDR6X (右) 之間的訊號眼形比較,PAM4 並不是直接傳輸兩位 2 進制訊號,而是使用了 4個不同的電壓水平,每個電壓電平相差 250mV,每個電平代表著 2 個數據位,透過電壓差提供 00、01、10 或 11 數據。

 

GDDR6X

 

 

為了解決 PAM4 技術的 SNR 訊噪問題,GDDR6X 提供了全新 MTA 編碼方案MTA,防止訊號從最高電平轉換到最低電平,反之亦然,從而提高了接口 SNR 。這是通過使每個引腳的一部分數據脈衝串在編碼引腳上傳輸的字節中的一部分(時間交織),然後使用明智選擇的代碼字將數據脈衝串的其餘部分映射到一個沒有最大躍遷的序列來實現的。最後,封裝和 PCB 設計均需要重新設計,並進行全面的信號和電源完整性分析,以實現更高的數據速度。

 

全新 GeForce RTX 3090 支援最高 19.5Gbps GDDR6X 記憶體、384-bit 記憶體介面,提供高達 963GB/s 記憶體頻寬,相較舊有 GeForce TITAN RTX 的 672GB/s 頻寬提高了 46%。

 

 

 

更大、更快的 L2 Cache

 

 

 GeForce RTX 3090GeForce TITAN RTX
Memory Interface384-bits384-bits
Memory TypeGDDR6XGDDR6
Memory Size24,576MB24,576MB
Memory Clock19.5Gbps145Gbps
Memory Bandwidth963GB/s672GB/s
ROPS11296
L2 Cache6,144KB6,144KB
Register File20.992KB18,432KB

 

 

除了全新的 GDDR6X 記憶體控制器外,「Ampere」GPU 同時改良了 Cache 緩存設計,GeForce TITAN RTX」與「GeForce RTX 3090 繪圖核心同樣具備 6MB L2 Cache 容量,但 Register Files 容量亦由 18,432 KB 提供至 20,992 KB。

 

ROP 設計方面,「Ampere」GPU 設計與上代「Turing」大致相同,每個 ROP 模組內包含 8 個 ROP 運單元,每個 ROP 單元單一週期可處理一個單色樣本,「GeForce RTX 3090」繪圖核心共有 14 個 ROP 模組、合共 112 個 ROP 運算單元。

 

 

 

RTX I/O︰GPU 直讀 PCIe SSD !! 性能 100 倍

 

RTXIO

▲ 傳統的遊戲讀取 I/O 方式

 

NVIDIA Ampere 微架構加入全新 RTX I/O 功能,可以讓 PCIe SSD 性能提升 100 倍,可望降低遊戲運算等待 I/O 讀取的 Overhead,配合明年 Windows 10 新增 DirectStorage API 。

 

NVIDIA RTX I/O 技術是為了配合明天 Microsoft Windows 10 的 DirectStorage API 而生,它可以實現 GPU 直接讀取 PCIe SSD 內的資料並實時進行資料解壓縮,它可以將 CPU 運算工作讓 GPU 分擔,實現更低延遲的遊戲新體驗。

 

以往,GPU 讀取遊戲資料都需要交由 CPU 處理器向 SSD 讀取,放進系統記憶體再由 GPU 讀取,這樣會出現嚴重 I/O 延遲並且非常佔用 CPU 資料,以 PCIe Gen 4 SSD 最高頻寬 7GB/s 為例,大約需要佔用 2 個 CPU Cores 的資源,如果要加入無損壓縮技術的話,就需要 24 CPU Cores 完全滿載才能應付,根本無法使用。

 

 

RTXIO

▲ 全新 RTX I/O 將改變了遊戲載入的方式

 

 

使用了 RTX I/O 技術後,GPU 不再需要向 CPU 提出 I/O 讀取要求,只需要透過 Microsoft DirectStorage API 直接經 PCIe 讀取 SSD 資料,處理 1:2 高質量紋理無損壓縮可以交由 GPU 負責,令 PCIe Gen 4 的可效頻寬由 7GB/s 提升至 14GB/s,但只需要佔用約 0.5 CPU Cores 資源,RTX IO將數十個CPU內核的工作分擔給GeForce RTX GPU,從而大幅提升遊戲 FPS 幀數,實現了近乎實時的遊戲載入,

借助 RTX I/O 技術無損壓縮,能有效降低開放性世界的遊戲體積,無需佔用太多的 SSD 空間、減少遊戲下載的時間從而使遊戲玩家可以在SSD上存儲更多遊戲,同時還可以提高性能,值得期待。

 

分享到:
發表評論