2012-03-16
全新「Kepler」GPU微架構
NVIDIA GeForce GTX 680繪圖卡
文: Xavier Ng / 評測中心


NVIDIA 推出全新「 Kepler 」 GPU 微架構、採用 28nm 制程由 TSMC 代工的「 GK104 」繪圖核心作出反撃。首款型號將為「 GeForce GTX 680 」,全新 SMX's CUDA Core 數目高達 1536 個,並加入大量 Fixed Function 的 Hardware Block 以提升 Rasterization 、 Shading 、 Texturing 及 GPU Compute 效率,配合全新 GPU Boost 技術針對 TDP 與功耗作出動態超頻,究竟全新「 GeForce GTX 680 」能否力壓「 Radeon HD 7970 」,成為新一代高階繪圖卡霸主 !?



全新 「 Kepler 」架構、進階 SMX 低功耗設計

NVIDIA GeForce GTX680
基於 28nm TSMC 制程、「 GK104 」繪圖核心內建 35.4 億個電晶體

 

目前 NVIDIA 在現有市場出售的 GeForce GTX 400 及 GTX 500 系列產品均為 「 Fermi 」架構核心,雖然比較早期的 「 G80 」 及 「 GT200 」 在運算效率上擁有明顯優勢,但高功耗表現卻一直成其致命傷,當時的「 GeForce GTX 480 」 及 「 GeForce GTX 470 」 的高熱量更成為一時熱話。有見及此, NVIDIA 已在新一代 「 Kepler 」 架構中大幅優化核心功耗方面的表現,並以高 Performance per Watt 作其中一大亮點。

 

一如對手 AMD 的 「 Southern Island 」 繪圖核心產品, NVIDIA 「 Kepler 」 核心已改用先進 28nm 新製程,此舉可讓開發商在相同面積下為核心加入更多電晶體,及有助減少晶體管工作時漏電的問題,令繪圖卡功耗有望得以下調,進而減低核心熱力,並提升時脈 空間。

 

實際上,全新「 Kepler 」核心並不能算得上是一顆完全新的核心架構,由於「 Kepler 」架構主要在 「 Fermi 2.0 」的基礎上優化而成,核心主要仍由多組 Raster Engine 、 Graphics Processing Clusters (GPC) 、 L2 Cache 及 Memory Controller 組建而成,但其內部架設卻已經過修改或提升。

 

不再採用「 1D 」架構   全新 SMX 設計 CUDA Core 大幅上升

 

首款登場的 「 GK-104 」核心便由第三代 Streaming Mulit-processor 進化至 SMX 設計,不但可提供較佳的運算效能,而且更可減低所需耗電量。 SMX 內部同樣以 CUDA Cores 、 PolyMorgh Engine 、 Texture Units 等組成,但 CUDA Cores 的數量卻大大提高,由上代「 GF110 」的最多 32 個增加至 192 個,整顆顯示核心的 CUDA Cores 數量為舊有的 8 倍,官方同時指 Performance per Watt 可因此而倍增。

 

NVIDIA GeForce GTX680

每組 Streaming Multiprocessors 數目的 CUDA Core 數目由 32 個提升至 192 個

 

CUDA Cores 將跟現有產品一樣主要用作 Pixel 、 Vertex 、 Geometry Shading 及 Physics 等運算,而 Texture Units 則主要處理 Filtering 及 Fetch 存取等工序,由於 CUDA Cores 數量的大增, SMX 架構可大大提升 Pixel 、 Vertex 、 Geometry Shading 等多方面的計算效率,運作時脈亦可因此而上調,讓顯示核心可在相同面積下提供更高的運算速度,再一次符合高 Performance per Watt 的宗旨。

 

至於主要負責進行 Tessellation 等計算的 PolyMorgh Engine 亦在 「 Kepler 」架構中升級至 2.0 ,集成的 Tessellator 已經過更新,運算效率為現有「 Fermi 」的 2 倍,對比 Radeon HD 7970 優勢更達 4 倍。

 

NVIDIA GeForce GTX680

Kepler 核心架構圖,集成 8 組 SMX 、 1,536 個 CUDA Cores ,數量遠高於現有產品,但記憶體規格卻下降至 256-bit

 

「 GK-104 」將以 2 組 SMX 建構成 1 組 GPC ,核心合共集成 4 組 GPC 及 4 組 Raster Engine ,並共享 768KB L2 Cache , Cache 規格跟現有「 Fermi 」系列相同。不過「 Kepler 」已更新 PCI-E 3.0 規格的支援,提高顯示核心與主機板之間的傳輸頻寬; NVIDIA 同時修改了 「 GK-104 」核心的 Memory Controller 規格,核心僅集成 4 組 64bit Memory Controller 規格,合共支援 256bit 記憶體,規格比上代 GF110 及主要對手 AMD 「 Tahiti 」 核心的 384bit 為低。

 

NVIDIA GeForce GTX680

全新 PolyMorgh Engine 2.0 大幅改良 Tessellation 性能。

發表評論