2012-03-16
全新「Kepler」GPU微架構
NVIDIA GeForce GTX 680繪圖卡
文: Xavier Ng / 評測中心


NVIDIA 推出全新「 Kepler 」 GPU 微架構、採用 28nm 制程由 TSMC 代工的「 GK104 」繪圖核心作出反撃。首款型號將為「 GeForce GTX 680 」,全新 SMX's CUDA Core 數目高達 1536 個,並加入大量 Fixed Function 的 Hardware Block 以提升 Rasterization 、 Shading 、 Texturing 及 GPU Compute 效率,配合全新 GPU Boost 技術針對 TDP 與功耗作出動態超頻,究竟全新「 GeForce GTX 680 」能否力壓「 Radeon HD 7970 」,成為新一代高階繪圖卡霸主 !?



NVIDIA GPU Evolution

 

G80

GPU 發展由 Fixed Fuction 、 Simple Shaders 發展至今日 Graphics Parallel Core

 

GPU 設計在進入 Direct X10 時代出現重大變化,由以往採用 Fixed Fuction 、 Simple Shaders 進化至 Graphics Parallel Core 設計,同時 GPU 亦不再局限於 3D 遊戲及繪圖應用,並朝向 GPGPU 通用運算發展, GPU 的用途變得更廣泛,這一年 ATI ( 及後被 AMD 併購 ) 與 NVIDIA 均朝向 Unified Shader 方向發展,但微架構理念卻各不相同。

 

 ATI 決定選擇 VLIW 架構 (Very Long Instruction Word) 的 SIMD 架構,每組 Stream Processor Unit 內建 5 個 ALU 運算單元,稱為「 VLIW5 」微架構,這 5 個 ALU 單元並非全功能,其中 4 個 ALU 單一週期可運算 4 個 32Bit FP MAD 、 2 個 64Bit FP MUL / ADD 、 1 個 64Bit FP MAD 或是 4 個 24Bit Int MUL / ADD 指令,卻不能執行 Special Function 或 Transcendentals 指令,餘下的一個是專門化 ALU ,單一週期可處理一組 Special Function 或 Transcendentals 指令,或是 1 組 32Bit FP MAD 指令。

 

採用「 VLIW5 」架構好處是 5 組 ALU 運算單元能共享一組 Branch Execution Unit 、 Registers 等單元,節省電晶體使用數,減低成本、晶片功耗及提升未來擴展性。同時, ATI 希望新架構在支援 DirectX 10 規格之餘,亦能提共優勢的 DirectX 9 的遊戲性能,「 VLIW5 」架構正好能滿足 DirectX 9 需要計算像素位置參數 (XYZW) 及顏色參數 (RGB) ,需要同時處理 4 筆資料的要求。

 

NVIDIA GeForce GTX680
NVIDIA PC GPU 事業群總經理 Drew Henry 分析 NVIDIA 全新 GPU 微架構的理念

 

NVIDIA 選擇了與 ATI 完全相異的 1D Scalar 的 MIMD 多指令多數據設計,每個 Stream Processor 僅內建 1 組全功能的 ALU ,並擁有獨立的 Branch Execution Unit 、 Registers 等,雖然 Stream Processor 所需電晶體相較對手多, ALU 數目亦較對手為低,在最高運算理論值上不及對手,簡單直接的 GPU 架構令內部單元運用效率高,不僅在 3D 性能上長期壓倒對手,同時亦有利於 GPGPU 領域發展。

 

為了解決此一缺點, AMD 推出了全新的「 GCN 」架構,在 SIMD 設計中加入了 MIMD 的元素,大幅提升了內部單元運用效率,令 Radeon HD 7000 系列性能大幅提升。 NVIDIA 雖然在效率上相較對手優勝, CUDA 當運算單元數目不斷增加, 1D Scalar 的 MIMD 設計相較對手的 SIMD 架構佔用更多的電晶體,為了減少 Die Size 及提升功耗性能比, NVIIDA 的 GPU 設計由單純的 MIMD 設計加入了 SIMD 單元,進入 Direct X 11 時代,兩者 GPU 微架構設計方向開始變得相近。

發表評論