2014-01-17
HSA架構、優化繪圖效能
AMD 「Kaveri」APU處理器正式登場
文: Xavier Ng / 評測中心


AMD 14 日正式發表新一代 APU 處理器,代號為「 Kaveri 」,由「 Steamroller 」架構 CPU 以及 Radeon R7 系列 GPU 整合而成,可提供高效繪圖能力,並首度支援 HSA 異構系統架構,可因應當前 GPU 使用量為 CPU 進行加速,進而提升 APU 整體運算能力。



整合「 Steamroller 」 架構 CPU 、 Radeon R7 系列 GPU

 

AMD 「Kaveri」APU

 

自 2011 年起, AMD 為主流桌上型平台首度發佈整合主流繪圖卡等級的 APU 處理器,以提供當代主流級效能的繪圖能力為賣點,力爭整合式入門平台市場,並直接影響到低階繪圖卡的價值,使近年繪圖卡廠商已偏向僅推出主流級或以上的獨立繪圖卡,而低階平台則以整合式處理器為主。

 

隨著「 Llano 」、「 Trinity 」及「 Richland 」等 APU 先後完成其使命後,踏入 2014 年, AMD 發表全新的「 Kaveri 」 APU 處理器,由 「 Steamroller 」 架構 CPU 以及 Radeon R7 系列 GPU 整合而成,除了一般的運算能力得到提升外,同時又可以滿足入門用家在進行遊戲或播放影片時得到更佳的聲畫娛樂享受。

 

其實「 Kaveri 」 APU 原定於去年推出,其架構資料早已被透露,不過最終因種種原因,令 AMD 於去年改為推出「 Richland 」作過渡,而「 Kaveri 」 APU 則延至今年才正式發表。受惠於採用 28nm 製程,其 Die Size 為 245mm2 ,內建 24.1 億個晶體,而且可在有限的面積下加入更多 GPU 和 CPU 密度,並減低電阻和提升核心時脈,而又能讓 APU 保持在最高 95W TDP 功耗水平。

 

Kaveri
AMD 「 Kaveri 」 APU 由 GPU 和 CPU 組成

 

在官方的資料中,不難發現「 Kaveri 」 APU 的 GPU 比例較 CPU 為多,最高為 12 核心 (4CPU + 8GPU) ,其中 CPU 部份採用「 Steamroller 」架構,以提升多程線程工作,以及單線程工作的效能為主,每周期可增加 30% 的 Ops 、每線程增加最多 25% 工作發送、減少 20% 的分支預測錯誤,以及減少 30% 的 I-Cache Misses ,而且也改進了執行單元以及 L2 Cache ,令效能得到提升。

 

GPU 部份佔下整體「 Kaveri 」的 47% ,內建 Radeon R7 系列核心,採用 GCN 架構,最高內建 512 個 Stream Processors ,時脈為 720MHz ,支援 AMD 引以自豪 Mantle API ,可讓遊戲開發者對應 GCN 繪圖架構為遊戲進行優化,也支援 TrueAudio 技術,為入門級用家提供比以往更高效的聲畫遊戲表現,還把視頻編碼引擎升級至 VCE 2 , H.264 YUV420 編碼中加入支援 B Frames ,而且加入支援 H.264 YUV444 (I Frames) For 60GHz 無線顯示。另外也升級至 UVD4 ,可改進錯誤恢復能力。

 

支援 HSA 異體架構全面提升效能

 

Kaveri
透過 HSA 異構系統架構提升 APU 的整體效能

 

今代 APU 除了提升 CPU 和 CPU 的架構和效能之外,最大賣點在於其 HSA 異構系統架構,提倡 CPU 與 GPU 共同計算,透過軟件和硬件分配 CPU 和 GPU 計算任務,達至提升效能的目的。 HSA 共包括三個部份,分別為「 hUMA 」、「 hQ 」以及「 UNLOCK APU GFLOPS 」。

 

其中「 hUMA 」是主要讓 CPU 和 GPU 可以共同使用記憶體空間 ( 最高為 32GB) ,好處是可以讓系統減省訪問記憶體的時間,大幅降低因為獨立記憶體定址帶來的延遲效應;「 hQ 」主要是讓 GPU 以及 CPU 核心的工作指令排序可以獨立分開,讓兩者更靈活地運作;而「 UNLOCK APU GFLOPS 」則是讓 APU 可發揮最高的運算潛能,例如當 CPU 運算在使用,而 GPU 卻在閒置未被應用時,這時便可以抽調部份 GPU 進行運算,進而提升整顆 APU 的效能。

發表評論