2010-07-14
全新GF104 GPU核心
NVIDIA GeForce GTX 460繪圖卡
文: John Lam / 評測中心


受 GF100 晶片良率欠佳影響, NVIDIA DX11 產品推出時程嚴重延宕,不僅晶片成本高昂,更重要的是良率偏低令 GF100 無法完全發揮 512 CUDA Cores 威力。終於全新效能級繪圖晶片 GF104 正式登場,在簡化架構後不僅良率大幅上升、成本下降,而且在整體效能上相較採用高階 GF100 繪圖核心的 GeForce GTX 465 更優勝,定價僅 $199-229 美元的 GeForce GTX 460 繪圖卡,能否為 NVIDIA 一洗頹風成為板卡業者焦點所在。



GF104 :每組 SM 的 SFU 單元增至 8 個     共合 64 個與 GF100 看齊

 

SFU
NVIDIA GF100 GPU 每組 SM 擁有 4 個 SFU

 

GF104 承繼了 Fermi 微架構的優勢, GF104 的 SM Unit 不只是數量上的增加,它更具編程彈性及更具效率,每一個 SM 單元內擁有 48 個 CUDA Cores 是上代的 6 倍,主要是針對未來遊戲對 Shader 運算的需要而作出最大優化。

 

採用了 Scalar 架構,無論是輸入任何大小的向量數據都能以最佳性能運算,並且可在執行 Z-buffer (1D) 或 Texture Acess (2D) 均能完全使用整個核心,每個 CUDA Processor 擁有完整的完全整數運算流水線邏輯單元 (ALU) 和浮點單元 (FPU) ,並實現了全新 IEEE 754-2008 浮點標準,提供融合乘加 (FMA) 指令,包括單及 雙精度運算。

 

FMA 指令改善了 MAD 做乘法和單一最後四捨五入動作,但沒有損失運算的精密度,令緊密重疊的三角形減少渲染錯誤的機會。

 

ALU 經過重新設計,支援所有完全 32Bit Prescision 指令,以符合標準編程語言的要求。整數 ALU 也作出優化 ,令繪圖核心更有效地支持 64Bit 和擴展精度運算,更多的指令標準在 GF100 被加入支援,包括 Boolean 、 shift 、 move 、 compare 、 convert 、 bit-field extract 、 bitreverse 、 insert 及 population count 。

 

雖然 GF104 繪圖核心與 GF100 繪圖核心同樣為 Fermi 微架構產品,但在 SM Unit 設計上 NVIDIA 已作出了調整,令它更切合實際運算需要,例如 GF104 繪圖核心把每組 SM 單元擁有的特殊功能單元 (SFU) ,由 4 組提升至 8 組,故此 GF104 並沒有因為 GPC 的數目減少,而令 SFU 單元被減少,同樣保持為 64 個,這些 SFU 單元可以執行 Sin 、 Cosine 、 Reciprocal 及 Square Root ,並負責圖形插補指令,每組 SFU 每個週期可完成一個指令或 8 個週期完成 32 Warp 線程, SFU 有效解決複雜的程序,特別是受益於複雜的陰影運算等。

 

SFU
NVIDIA GF104 繪圖核心每組 SM 則增至 8 個 SFU

 

GF104 :增加 Instruction Dispatch Unit 數目以配合架構調整

 

Dispatch
NVIDIA GF100 GPU 每組 SM 擁有 2 個 Instruction Dispatch Unit

 

由於 GF104 在每組 SM Unit 內的 CUDA Core 及 SFU Unit 數目上大幅提升,為了讓這些單元不會因被浪費及閒置, GF104 增加了 Instruction Dispatch Unit 作出配合。 GF100 繪圖核心時擁有兩個 Dual Warp Scheduler Unit 及兩個 Instruction Dispatch Unit ,容許它們同時發出及執行指令, GF100 繪圖核心透過這兩個 Warp Scheduler 及 Instruction Dispatch Unit 以控制每 SM 單元內的 CUDA Core 、 16 Load/Save Units 及 4 個 SFU 。由於 Warp 執行變得完全獨立,因此 GF100 晶片不需要檢查內部指令的流向,令 GF100 的運算峰值與實際運算能力十分接近。

 

GF104 每組 SM 則擁有 4 組 Instruction Dispatch Unit ,以應付提升至 48 個 CUDA Core 及 8 個 SFU 單元的需要。值得注意的是,大部份指令均支援 Dual Issued ,包括兩個浮動的指示,或混合整數、浮點、加載、存儲和 SFU 指令均可以同時執行,僅有雙精度指令配合其他指令時,不支援 Instruction Dispatch 。

 

Dispatch
NVIDIA GF104 GPU 每組 SM 則提升至 4 個 Instruction Dispatch Unit

分享到:
網友評論
本篇文章被 155510 人閱讀,共有 34 條評論
確實係gtx 4xx入面最有性價比既卡
hope AMD will respond quickly and lower its prices
460要5770同價位$12XX才會見得到優勢
暫時未見得有壓倒性嘅優勢~睇定d先
最緊要減價益用家
睇黎nV終於醒覺
E張入得過
28C真係仲cool過HDD
GTX460 同 當年推出 9600GT 一樣
希望今次 nVIDIA 唔會浪費左 G94 (9600GT) 咁唔好放過AMD
十分期待gtx475!!
NV新卡中, 只對呢張有衝動........
NVIDIA 今次改善得很多......
今期到ATI 要頭痕.....除非 6 系再有一大進步...
Seems like NVIDIA finally play a good match this time...
But looks like the benchmark got some bias...all the games tested are pro-N games and benchmark....
一洗Fermi GF100的缺點
這一張GTX 460真的不錯
哇 睇到D TEXT好靓仔 睇來會成為尼期最熱門卡 N卡改頭換面啦
之前都知460(768mb)~5830
但估唔到460(1gb)可以同5850一較高下!
a/n終於有得正面交鋒!
n卡終於有野睇~
GTX460 1Gb 企在229美元, 而目前5850大約299美元, 如果ATI將之降價至249美元, 你地會揀邊張呢?
GTX460 1GB
http://www.anandtech.com/show/3809/nvidias-geforce-gtx-460-the-200-king/6

但在以上個網站及有些網站我就見到ATI5850大部分遊戲表現都領先GTX460 10%-15%
依編明顯係"膳稿", 樓上不用太認真....
要影片嗎? 我地有拍片wor
其實唔係太過壓到性勁過對手,都唔係乜野大問題 (始終要睇埋 driver)
反而我想知佢的定價會係幾多。萬一定價太高,倒頭來都係無優勢
呢度個test,唔計oc版都係有部份game 5850較強
farcry不嬲都係NV D卡勁D
不過有D GAME的確係對NV卡有D利,好似Heaven果D咁要行Tessellation
其實都係睇你玩咩GAME
very promising GF104. might finally get an Nvidia card
都咁耐了, 5850 係時候降價, haha
遲人哋A記10多個月出,效能先跟人哋"不相百仲",雖則遲啲良率提高好可能解封埋剩餘嘅SM unit,咁A記都出HD6K series喇
N記fans查實點睇N記?次次入新卡無耐就有同架構嘅"全效能版"推出
根據最新消息: A記6系最少要到今年年底先出到.
如果價錢再平d,益下我地d用家就完美了^^
我想知家GTX460 1GB version同我張EVGA GTX285 在效能上有幾多分別? 如果無分顯分別就忍下手先
jackyfai:
我覺得分別唔會太大
岩岩出實貴
re jackyfai:
285起碼都換480先叫有分別
460同275同級
Buy later if price drops more
發表評論
僅限會員回應,請先登入。
用戶名 密碼