2008-06-25
全新RV770繪圖核心
ATI Radeon HD 4850繪圖卡
文: Kopo Ko / 評測中心


AMD 25 日正式發佈全新效能級繪圖晶片,核心代號為 RV770 ,並命名為 Radeon HD 4800 家族,一改傳統 GPU 研發策略,僅專注效能級市場需求出發,憑著 800 個 Stream Processing Unit ,令 NVIDIA 完全措手不及,迫使 GeForce 9800GTX 大幅降價迎戰。 HKEPC 編輯部找來 MSI Radeon HD 4850 繪圖卡,將解構全新 RV770 核心並進行效能對比測試。



V770 ︰改良 Cache Design 、 記憶體控制器

 

 

為提高 Texture 效率, RV770 進一步改良 Cache 系統, L1 Texture Cache 由以往提供給所有 SIMD 共享,改為每組擁有獨立、較細的 L1 Texture Cache ,讓每組 SIMD 存放與自己相關連、獨立的資料, Latency 大幅下降, L1 Cache 的效率能提升 2x ,整體 Cache 效率提升達 5x 。

 

沒有了共享的 L1 Texture Cache 架構, RV770 加入了 16KB Globle Data Share ,作為每組 SIMD 的資料溝動渠道。此外,另設獨立的高速 Vertex Cache 以提升 Vertex 及 Geometry 執行效率,讓更多的 Geometry Shader Data 可以放在晶片內,令 Geometry Thread 的處理效率相比上代 RV670 高出 4x 。

 

此外, L1 及 L2 Cache 的頻寬亦大幅提升了, RV770 的 L1 Texture Cache 最高速達 480Gb/s ,而 L1 與 L2 Cache 之間頻寬亦提升至 384GB/s 。

 

一直被 AMD 推荐的 Ring Bus 在今代被正式放棄,換回傳統的 Full Distributed with Hub 設計,主要原因是 Ring Bus 在 R600 、 RV670 並沒有顯出其應有的優勢,相反在部份情況下 Latency 提高、佔用更多電晶體及功耗增加,今代 RV770 換回 Fully Distributed 可以說是預期之中。

 

RV770 最高支援 256Bit 記憶體介面,加入 Fast MemExport/Import 功能, Scatter 及 Gather 動作的速度是上代 RV670 的 2x ,並支援高達每筆 16 個 64Bit exports 或 8 個 128-bit exports 。

 

 

RV770 ︰改良 Render Back-Ends 設計

 

Render Back-End 方面, RV770 與上代 RV670 一樣擁有 4 組,取消了以往專門針對透明及霧化的運算單元,但 Z/Stenicil Unit 由上代 RV670 的 8 個,提供至今代的 16 個,令 RV770 的 depth/stencil 指令執行數由上代的每筆 32 個提升至 64 個。

 

這項改動令 RV770 在 AA 模式下 32Bit Color 及 64Bit Color 的 Fill Rate 提升一倍,而非 AA 模式下 64Bit Color 的 Fill Rate 亦能提升一倍。

 

 RV670RV770
Depth/Stencil Only32 pix/clk64 pix/clk
32Bit 
No MASS16 pix/clk16 pix/clk
2x/4x MSAA8 pix/clk16 pix/clk
8x MSAA4 pix/clk8 pix/clk
64Bit 
No MASS8 pix/clk16 pix/clk
2x/4x MSAA8 pix/clk16 pix/clk
8x MSAA4 pix/clk8 pix/clk

分享到:
發表評論