
繼月初 AMD 宣佈推出新一代 Radeon R9 及 R7 系列繪圖卡後,市場一直期待旗艦型號 Radeon R9 290X 的推出,採用設計經改良優化而成的「 Hawaii 」繪圖核心,加上搭載達 512bit 4GB GDDR5 記憶體,效能直逼最強單核心繪圖卡,更重要的是其售價僅為 US$549 ,售價比較同級對手更為「親民」, HKEPC 特別找來全新 AMD Radeon R9 290X 為讀者們探討其設計及效能表現。
傳說中的 GCN 2.0? Hawaii 核心之優化
Radeon R9 290X 的 Hawaii 採用大核心設計,但在 Shared resources 比例上更加合理。
早於去年即已傳出 AMD 新一代繪圖核心「 Hawaii 」會採用 GCN 2.0 架構,更認為所謂 GCN 2.0 架構只是 AMD 整合 GCN 架構之使用經驗優化而成。最終隨著「 Hawaii 」核心的發佈,新核心採用的仍然為 GCN 架構,但可見 AMD 總結 GCN 架構上之使用經驗提供究極優化,提供最佳效能。
為甚麼說是究極優化呢 ? 這裏要先簡單介紹一下 GCN 架構的特色, AMD GCN 架構針對此前 VILW 4/5 架構的不足作出改進,改進執行效能,並仿傚 x86 ISA 的設計,為未來 AMD Heterogeneous System Architecture 功能作準備。 GCN 架構分為 Private 及 Shared resources , Private resources 包括 Instruction buffering 、 registers 及 vector ALUs ,以提供高效能及高資源利用率為先。 Shared resources 包括 front-end 、 branch unit 及 data caches ,以減少佔用晶片的空間及提升能源效能比為主。
對於「 Hawaii 」核心來說, AMD 一方面增加 Private resources 的數目,使 Radeon R9 290X 繪圖卡擁有 2816 個 Stream Processors 及 176 個 Texture Units ,對比 Radeon HD 7970 的 2048 個及 128 個。由於擁有更多的運算資源,所以 GPU Textures fill rate 提升了一倍, GPU 的 FP 運算能力分別達到 5.6TFLOPS Single Precision 及 1.4TFLOPS Double Precision 。
這點十分重要,因為 AMD 並未如 NVIDIA 刻意為 GK110 加強 Double Precision FP 性能,其 Double Precision FP 相當於 Single Precision 的 1/4 而非 GK110 的 1/3 。結果 Radeon R9 290X 藉著更多的 Stream Processors ,在 Single Precision FP 全面領先 GTX Titan 及 GTX 780 , Double Precision FP 在兩者之間,十分不俗。
Geometry Engine 及 ROPs 數目進一步增加
在 GCN 推出的初期, AMD 嘗試了「 Tahiti 」及「 Cape Verda 」兩大核心,以及集兩顆「 Cape Verda 」核心而成的「 Pitcairn 」核心,它們在 Shared resources 的數目上也有不同。對於「 Tahiti 」核心來說,由於 AMD 在有限的核心內加入太多 GCN Compute Unit ,沒有同時提高共享資源如 Geometry Engine 、 Color ROP Units 及 Z/Stencil Units ,結果有評測發現 Radeon HD 7970 快不了 Radeon HD 7950 多少,反應「 Tahiti 」核心共享資源不足的問題。在「 Cape Verda 」核心設計中, AMD 把 GCN Compute Unit 與 Geometry Engine 、 Color ROP Units 及 Z/Stencil Units 的比例降為 10:1:16:64 ,並為「 Pitcairn 」核心所承,其比例為 20:2:32:128 ,皆比「 Tahiti 」核心的 32:2:32:128 為寬裕。
AMD 在吸取「 Tahiti 」及「 Cape Verda 」兩大核心的使用經驗後,將成果應用到「 Hawaii 」核心上。「 Hawaii 」核心分為 4 個獨立的 Shader Engine ,擁有 1 個 Geometry Processor 及 16 個 Color ROP Units 及 64 個 Z/Stencil ROP Units ,可設有最多 11 個 GCN Compute Units ,使 GCN Compute Units 對各資源的比例為 11:1:16:64 ,十分接近「 Cape Verda 」的比例,而整個「 Hawaii 」核心共有 44 個 GCN Compute Unit 、 4 個 Geometry Processor 、 64 個 Color ROP Units 及 256 個 Z/Stencil ROP Units 。
Radeon HD 7970 的「 Tahiti 」核心 Shared resources 相對較少
Radeon HD 7770 的「 Cape Verda 」核心在 Shared resources 比例上較好,為後續產品所採用。
Radeon HD 7870 的 Pitcairn 核心可視為 2 顆「 Cape Verda 」核心的合成品。
筆者毫不意外 AMD 這次增加 Geometry Engine 的數目,因為增加 Geometry Engine 數目可以提升 Tessellation 效能,這從「 Pitcairn 」、和「 Bonaire 」核心皆內建 2 個 Geometry Engine 可以得見。由於擁有 4 個 Geometry Engine ,「 Hawaii 」的 prim/clk 從 Tahiti 的 2 prim/clk 增加一倍至 4 prim/clk , triangles/sec 性能從 2.1 billion triangles/sec 增加 90% 至 4 billion triangles/sec ,可滿足 4K Gaming 的需要。另外,「 Hawaii 」核心也把 ACE (Asynchronous Compute Engine) 的數目大幅增至 8 個,對比「 Tahiti 」、「 Cape Verde 」、「 Pitcairn 」或「 Bonaire 」核心的 2 個 ACE 設計,可管理最多 8 queues 是從前的 4 倍,能有效提升 multi-tasking 性能。
「 Hawaii 」核心分為 4 個獨立的 Shader Engine ,資源分配更為有效。
「 Hawaii 」核心擁有 4 個 Geometry Engine ,大大提升 triangles/sec 性能。 >
「 Hawaii 」提供 8 個 ACE ,可同時管理多達 8 queues 。