2010-10-11
全新GF108 GPU核心
NVIDIA GeForce GT 430繪圖卡
文: Gary Ng / 評測中心


NVIDIA 11 日正式發佈首款基於全新 Fermi 微架構「 GF108 」繪圖核心,針對入門級遊戲應用及數位影像處理的「 GeForce GT 430 」繪圖卡產品,將取代舊有 GeForce GT220 產品,對手預定為 Radeon HD 5550 及 5570 。 NVIDIA 把「 GeForce GT 430 」定位為數位影像處理應用而非遊戲應用產品,整個記者會從未與競爭對手作性能差異比較,究竟這款繪圖卡的性能如何 !? HKEPC 將詳細分析全新 GeForce GT 430 架構設計,並對比自家上代產品與對手同級產品間之效能差異。



GF108 : 16 組 SFU 單元

 

SFU

 

現今遊戲為了提升陰影應用來加強遊戲真實性,越來越多加入 Sin 、 Cosine 、 Reciprocal 及 Square Root 運算 ,主要負責圖形插補指令,而 SFU 單元則有效解決複雜的程序,特別是受益於複雜的陰影運算等。

 

由於「 GF108 」繪圖核心是基於「 GF104 」的 SM 單元設計,因此每組 SM 單元內建 8 個、整顆晶片合共 16 個 SFU 單元,是「 GF106 」繪圖核心的一 半,如果對比上代 GeForce GT220 的「 GT216 」繪圖核心僅有 12 組單元的 SFU ,在處理 Sin 、 Cosine 、 Reciprocal 及 Square Root 運算當然有其優勢。

 

如果對比上代「 GT215 」繪圖核心的 GeForce GT240 ,雖同樣具備 96 CUDA Core ,但由於「 GF215 」擁有較多的 24 組 SFU 單元,不過「 GT108 」的 SFU 處理單元時脈較高,加上全新 Fermi 的 SFU 單元可以在每個週期可完成一個指令或 8 個週期完成 32 Warp 線程,效率較上代大幅提升,相信「 GF215 」與「 GT108 」的 SFU 性能會在伯仲之間,勝負要取決於程序編寫應用方式。

 

GF108 ︰ 128Bit 記憶體控制器、 16 Texture Units 、 4 個 ROP

 

 GF106GF108GT215GT216
CUDA Cores192969648
Texture Units32163216
ROP Units16488
Memory interface128bit128bit128bit128bit
Memory TypeGDDR5DDR3GDDR5DDR3
GPU Clock (MHz)783700550625
Shader Clock (MHz)1566140013401360
Memory Clock (MHz)36081800

3400

1580
Memory Bandwith (GB/s)57.7328.854.425.3
L2 Cache Size256KB128KB--
Texture Filling Rate (GT/s)25.0611.217.610
Fabrication Process40nm40nm40nm40nm
Transistor Count (million)1170585727486
TDP106W49W69W58W

 

記憶體控制器方面,「 GF108 」與「 GF106 」擁有 2 個 64Bit 記憶體控制器,合共擁有 128Bit 記憶體寬度,沒有跟蹤 SM Unit 數目被同時減半,不過改用時脈較低的 DDR3 記憶體,成為兩者在記憶體頻寬上的差異。

 

不過, NVIDIA 在記者會上表示,「 GF108 」的記憶體控制器可支援 GDDR5 記憶體顆粒,但市場定位並非主流遊戲玩家市場,因此沒有提出採用 GDDR5 顆粒的 SKU 。

 

Texture Units 方面,「 GF108 」的 Texture Units 同樣為「 GF106 」的一半,僅擁有 16 組 Texture Units 與上代「 GT216 」相同,由於現時遊戲偏向 Vertex 、 Pixel 及 Geometry 運算,已大幅減少使用 Texture 紋理渲染。 Polymorph Engine 數目同樣減半至只有 2 組,由於現時遊戲不會大量採用 Tessellation 技術,加上要符合入門級繪圖卡產品在性價比上的需要,「 GF108 」的 Texture Units 與 Polymorph Engine 核心單元數目設定絕對可以理解。

 

但值得注意的是,「 GF108 」只有一組 ROP 運算組,運算組內只有 4 個單元,這是「 GF106 」的 ROP 數目的 1/4 ,這些負責負責 Pixel Blending 、 Anti-Aliasing 及 Atomic 記憶體操作的單元,就算上代「 GT216 」也擁有 8 個 ROP 單元,因此「 GF108 」在開啟反鋸齒、霧化效果等等,「 GF108 」效能將會嚴重下跌,儘管 CUDA Cores 數目提升,僅 4 個 ROP 單元將成為「 GF108 」繪圖核心的主要瓶頸之一。

 

如果以 GF108 的單元數目設定而言,的確 NVIDIA 在提升 CUDA Core 數目上並非以遊戲效能作首要考量,它更偏向提升 CUDA 運算能力、強化影像及圖像處理加速而生。

發表評論