2015-01-22
全新「GM206」繪圖核心登場
NVIDIA GeForce GTX 960架構分析
文: John Lam / 評測中心


緊接 GeForce GTX 980 、 970 高階繪圖卡型號, NVIDIA 22 日正式推出全新「 Maxwell 」 GPU 微架構效能級繪圖卡型號「 GeForce GTX 960 」。基於全新「 GM206 」繪圖核心具備經改良 SMM CUDA 模組設計、升級 PolyMorph Engine 3.0 引撉及進一步強化記憶體系統,不僅在 GPU 運算性能方面明顯提升,同時具備更佳的省電效果及更高性價比表現,硬體 VXGI 立體像素全域照明運算加速,全新的動態超高解析度技術及 MFAA 反鋸齒技術,讓效能級繪圖卡的遊戲效果進入全新里程。



L2 Cache 容量提升一倍 加入第三代 Delta Color 壓縮引擎

 

記憶體頻寬方面,「 GeForce GTX 960 」的「 GM206 」繪圖核心內建 2 組 64Bit 記憶體控制器、總數為 128Bit 記憶體介面,相較前代「 GeForce GTX 760 」的「 GK104 」繪圖核心內建 256Bit 記憶體介面規格少了一半,數字上的明顯差距讓不少遊玩家擔心「 GeForce GTX 960 」會否因頻寬不足影響其 3D 繪圖性能。

 

其實, NVIDIA 在研發「 Maxwell 」 GPU 微架構時的其中一大方向,就是提升記憶體控制器的效率,基於 GPU 微架構改良優化記憶體子系統性能。因此, NVIDIA 針對「 GM206 」繪圖核心的 L2 Cache 容量提升至 1MB ,相較「 GK104 」繪圖核心內建 512KB L2 Cache 多出一倍,此舉有效提升緩存資料數量及命中率,記憶體存取次數及記憶體頻寬佔用因此減少,同時存取延遲大幅降低。

 

GM204

 

要解決記憶體頻寬瓶頸問題,除了提升記憶體介面頻寬外,同時亦可透過提升 ROP 運算單元對 Texture Data 進行無失真壓縮的性能,以節省所佔用的頻寬,並於「 Fermi 」 GPU 微架構中引入首代 Delta Color Compression 引擎,透過多層壓機制選擇最佳的壓縮比, Texture 內的每一 Pixel 將會與相鄰的 Pixel 進行對比,透過數學運算提供更高壓縮比,其後在「 Kelper 」 GPU 微架構中進一步改良引入第二代 Deltra Color Compress 引擎。

 

全新「 Maxwell 」 GPU 微架構針對 ROP 運算單元作出改良,採用了第三代 Delta Color Compression 引擎, NVIDIA 指出 Delta Color Compression 是壓縮效率高低的主要關鍵,視乎 ROP 運算單元選用 Pixel Ordering 排序算式,「 Maxwell 」 GPU 微架構進一步新增不同形式的 Pixel Ordering 排序算式,讓 ROP 運算單元擁有更多 Pixel Ordering 排序算式選擇,從而令壓縮性能大幅提升。

 

此外,全新「 Maxwell 」的 ROP 模組設計經重新改良,因此擁有更高的像素填充能力,在高解析度的性能表現、處理光線反射、 AA 反鋸齒、煙霧、火焰等特效的運算能力均較上代「 Kelper 」 ROP 運算單元有更高性能表現。

 

GM204

 

據 NVIDIA 表示,受惠於 L2 Cache 容量提升與壓縮引擎改良,「 Maxwell 」記憶體架構效率在同一頻寬下,性能相較上代「 Kelper 」提升 33% ,以 GeForce GTX 960 記憶體時脈為 7010MHz Data Rate ,其性能表現約等於上代「 Kelper 」在相同記憶體介面下運作於 9300MHz Data Rate 。

 

儘管 NVIDIA 針對「 GM206 」繪圖核心的記憶體子系統作出優化,更大的 L2 Cache 、更先進的壓縮引擎、更高的記憶體運作時脈,但面對上代「 GeForce GTX 760 」的 256Bit 記憶體介面,記憶體頻寬高達 192.2GB/s ,「 GeForce GTX 960 」的 128Bit 記憶體介面在規格上僅能提供 112.2GB/s ,將 33% 性能提升計算在內即等同「 Kepler 」微架構下的 148.8GB/s 頻寬,「 GeForce GTX 960 」在記憶體子系統性能上不及上代是不爭的事實。

 

 GeForce GTX 960GeForce GTX 760GeForce GTX 660
GPUGM206GK104GK106
L2 Cache1024 KB512 KB384 KB
Memory Interface128 Bit256 Bit192 Bit
ROPs323224
Memory Speed
7010 MHz6002 MHz6002 MHz
Memory Bandwidth112.2 GB/s
192.2 GB/s
144.2 GB/s
Effective Bandwidth148.8 GB/s
 - -
分享到:
發表評論
本篇文章被 127663 人閱讀,共有 個評論