2014-10-12
全新「GM204」繪圖核登場
NVIDIA GeForce GTX 980架構分析
文: John Lam / 評測中心


NVIDIA 正式發佈新一代「 Maxwell 」 GPU 微架構高階繪圖卡「 GeForce GTX 980 」,基於全新「 GM204 」繪圖核心採用了經改良 SMM CUDA 模組設計、升級 PolyMorph Engine 3.0 引擎及進一步優化記憶體架構,令繪圖卡性能進一步提升下功耗卻大幅下降。此外,「 GM204 」繪圖核心加入了硬體 VXGI 立體像素全域照明運算加速,全新的動態超解析度技術及 MFAA 反鋸齒技術,令提升了 PC 遊戲效果進入全新里程。



全新 「 GM204 」繪圖核心

 

GM204
NVIDIA GM204 繪圖核心 Die Shot

 

今年 2 月, NVIDIA 已發佈了首款基於「 Maxwell 」 GPU 微架構的繪圖卡繪圖晶片、核心代號為「 GM107 」,並推出了定位於主流級及低功耗應用市場「 GeForce GTX 750 」及「 GeForce GTX 750 Ti 」繪圖卡,雖然晶片仍然採用 TSMC 28nm 制程,但透過改良 Streaming Multiprocessor 內部設計,提供了優秀的 Performance per Watt 表現,當中「 GeForce GTX 750 Ti 」甚至在部份 DirectX 11 測試中力壓「 GeForce GTX 480 」,所需功耗卻只有後者的四份之一。

 

相隔半年後, NVIDIA 正式終於發佈新一代「 Maxwell 」 GPU 微架構高階繪圖核心、核心代號為「 GM204 」,它是首顆具備完整的「 Maxwell 」 GPU 微架構產品,相較「 GM107 」繪圖核心支援 CUDA Compute 5.0 ,全新「 GM204 」繪圖核心已提升至支援 CUDA Compute 5.2 ,同時增了多項繪圖技術包括︰ VXGI 立體像素全域照明、 MFAA 多幀取樣反鋸齒、 DSR 動態超高解析度 、 VR Direct 立體影像技術等,同時在顯示輸出中追加了 HDMI 2.0 支援,均是「 GM107 」繪圖核心所欠奉的。

 

GM204
NVIDIA GM204 繪圖核心 Block Diagram

 

「 GM204 」繪圖核心採用 28nm 制程由 TSMC 代工,內建 52.2 億個電晶體, Die Size 為 398mm² 擁有 4 組 GPC 圖形處理群,每組 GPC 圖形處理群內擁有一個獨立的 Raster Engine 光柵處理引擎及 4 組 Maxwell Streaming Multiprocessor(SMM) 模組,每一個 SMM 模組內共有 128 個 CUDA Cores 及 8 個 Texture Units ,整顆繪圖核心合共有 2048 個 CUDA Cores 及 128 個 Texture units 。

 

「 GM204 」繪圖核心內建 4 組 64Bit 記憶體控制器,每組記憶體控制器緊連著 16 個 ROP 單元及 512KB L2 Cache ,因此整顆繪圖核心擁有 256Bit 記憶體介面、 64 個 ROP 單元及 2MB L2 Cache 。

 

「 GM204 」︰全新 Maxwell SMM 模組

 

「 Maxwell 」 GPU 微架構延續了上代「 Kelper 」 GPU 微架構的 SMX 模組設計方向,並按照現今遊戲對不同類別的數學及 Texture 運算比例,重新設計新一代 Maxwell Streaming Multiprocessor(SMM) 模組,以提升 GPU 的運算效率與功耗性能比表現,同時升級至第三代 PolyMorph Engine 令 Tessellation 運算能力進一步提升。

 

全新「 Maxwell 」 SMM 模組的 CUDA Core 數目由上代的 192 個減少至 128 個, Texture Unit 亦由 16 個減至 8 個, NVIDIA 認為這個架構更符合現今遊戲要求,而且 SMM 模組內各個 CUDA Cores 、 Load/Store 單元及 Special Fucntion 單元,將會被平均分割成 4 個 CUDA Processing 區塊,每個區塊各自擁有獨立的 Instruction Buffer 、 Warp Scheduler 、 Instruction Buffering 、 Dispatch Unit 及 Register File ,令運算效率相較「 Kelper 」的 SMX 模組讓 192 個 CUDA Cores 共享更具效率。

 

相較「 Kepler 」 SMX 模組,「 Maxwell 」 SMM 模組內的緩存結構亦作改動,不再採用 L1 Cache 與 Shared Memory 不再共享,把 Shared Memory 由 L1 Cache 中獨立分割出來,同時容量由 64KB 提升至 96KB ,原本的獨立的 Texture Cache 與 Uniform Cache 則與 L1 Cache 結合。

 

SMM
NVIDIA 「 Maxwell 」 SMM 模組內部設計

 

受惠於「 Maxwell 」 SMM 模組的重新設計,全新「 Maxwell 」 GPU 微架構的 CUDA Cores 運算效率相較上代「 Kepler 」大幅提升 40% ,其功耗性能比提升了 1 倍。如果以 SM 模組層面來說,「 Maxwell 」 SMM 模組僅擁有 128 個 CUDA Cores ,其性能卻與 192 個 CUDA Cores 的「 Kepler 」 SMX 模組相約,更節省所需的電晶體數目與功耗需求。

 

 

 GTX 980GTX TitanGTX 780 TiGTX 780
Process28 nm28 nm28 nm28 nm
CoreGM204-400-A1GK110-A1GK110-B1GK110-A1
Transistors5.2 billion7.1 billion7,1 billion7,1 billion
GPU ArchitectureMaxwellKeplerKeplerKepler
CUDA Cores2048268828802304
Engine Clock1,126 MHz837 MHz875 MHz863 MHz
GPU Boost Clock1,216 MHz876 MHz928 MHz900 MHz
Single Precision (GFLOPS)4,612 GFLOPS4500 GFLOPS5040 GFLOPS3979 GFLOPS
Double Precision (GFLOPS)144 GFLOPS (1/3)*1300 GFLOPS (1/3)*210 GFLOPS (1/24)166 GFLOPS (1/24)
Memory Type256-bit384-bit384-bit384-bit
Memory Size4 GB GDDR56 GB GDDR53 GB GDDR53 GB GDDR5
Memory Date Rate7 012 MHz6 088 MHz7 000 MHz6 008 MHz
Memory Bandwidth224 GB/s288 GB/s336 GB/s288 GB/s
Power Connectors6+6-pin6+8-pin6+8-pin6+8-pin
Monitors Output1 st. DVI2 st. DVI2 st. DVI2 st. DVI
 1 st. HDMI1 st. HDMI1 st. HDMI1 st. HDMI
 3 st. DP1 st. DP1 st. DP1 st. DP
TDP165 W250 W250 W250W

 

 

發表評論