7年來第一次:PowerVR GPU升級真正全新架構

本帖最後由 C.K.F. 於 2017-3-10 18:59 編輯

7年來第一次:PowerVR GPU升級真正全新架構
由 kai 於 星期四, 2017-03-09 11:19 發表


在加州聖克拉拉舉辦的年度技術峰會上,Imagination拋出重磅炸彈,宣佈了2010年以來的第一個真正 全新GPU架構,代號“Furian”。七年前的“Rogue”架構是PowerVR GPU第一次採用統一著色器設計,如今已經遍佈全球各個領域,PowerVR 6/7/8系列都是基於它衍生來的。
Furian的設計首要目標是改進功耗和性能,具體來說就是每毫瓦性能、每平方毫米性能,號稱相比於7XT Plus可提升35%的著色器性能、80%的填充率性能(沒說圖元還是紋理)、70-90%的綜合性能。


Furian架構總覽
Furian架構不是從零開始設計的,而是在Rogue的基礎上全面翻新。它還是基於區塊延遲渲染(Tile Based Deferred Rendering),但幾乎每個模組單元、資料流程、整體佈局都是新設計的,比如支援多執行緒多工資料執行,比如微內核固件控制,比如幀緩衝和幾何無失真壓縮,比如新的安全和虛擬化技術,比如增強的擴展性,這對於未來深挖潛力十分關鍵。
新架構在最核心的ALU Cluster(算數邏輯單位叢簇)方面大大改進,尤其是在每個單獨流水線內將原來成對的MAD ALU換成了一個MAD ALU、一個MUL ALU,前者可做加法和乘法,後者只做乘法。
這樣的結構效率更高,也更節能——MAD ALU大得多,也需要更多資源才能喂飽。
同時,新架構將每個叢簇的流水線從16級擴展為32級,可降低控制電路負載,而且整體叢簇少了,紋理單元就可以上去了,每時鐘週期的雙線性採樣翻番到8個。
新架構還支持尚未定案的OpenCL 2.x計算標準,以及全面支持Vulkan、OpenVX。



ALU叢簇總覽



Furian架構佈局變化



ALU密度和效率改進:流水線翻番
Furian架構是面向未來的,可以滿足7nm工藝、VR遊戲、4K超高清、120fps高幀率、HDR高動態畫面、神經網路等等的需求。
不過,Imagination今天只是宣佈了新架構,並沒有任何新的產品設計(雖然提到了PowerVR 8XT),具體還要看後續規劃,以及晶片廠商的設計。
至於基於新架構的實際產品,差不多得到2019年了。



Furian新架構來也



Furian架構要特點



架構變換努力方向



PowerVR進化史



兩代架構提升對比



Furian架構的一些核心特點



更具靈活性






擴展性極強



GPU計算增強



單獨的固件處理器



高效率系統集成



市場方向:下一代自動駕駛、移動、平板、變形產品



市場方向:下一代VR/ARAI、神經網路、深度學習



架構匯總

本帖最後由 youarehere 於 2017-3-11 18:21 編輯

終於有新野, 只要performance per watt keep住做得好, 就冇咩問題
但做好埋performance per dollar先可以反攻android市場

TOP

驚豔!次世代互動式圖形和視覺的酷炫新體驗!Imagination揭開全新PowerVR Furian GPU架構的神秘面紗

新架構顯著升級性能和能效,高效滿足VR/AR、機器智慧與ADAS等新一代應用需求

2017年3月9日 ─ Imagination Technologies 宣佈推出新一代的 PowerVR Furian 架構,這是專為滿足下一代消費類設備持續演進的圖形與運算需求所設計的全新 GPU 架構。

VR/AR 和 convertibles 等應用需要更高的圖形解析度與幀率,而 ADAS 與機器智慧等新興應用則需要更高的運算效率。專為這些應用所設計的配件通常是採用14nm以下的先進制程。Furian 可通過多重方式來提升性能可擴展性,以滿足這些需求,同時採用可擴展的設計架構,並專注於在最後的制程階段輕鬆實現系統整合與佈局 (layout)。憑藉採用 Furian 架構,嵌入式產品將能以移動設備的功耗預算,在長時間內提供高解析度、沉浸式圖形內容以及資料運算功能。

眾所周知, 多年來PowerVR Rogue 架構已成為業界標竿;在此基礎之上,Furian 架構專為強化能源效率所設計,並擴大了與競爭者的解決方案之間每微瓦能效的差距。擁有 Furian 與 Rogue 兩個功能強大的架構,Imagination 將能滿足各種性能運算需求,提供業界最完整與高效的 GPU IP 內核組合。

ABI Research 董事總經理兼Video、OTT 和 AR/VR 副總裁 Sam Rosen 表示:“AR/VR 及機器學習等新興應用已為 GPU 帶來了更嚴酷的新需求。針對這些應用,GPU 必須能執行傳統圖形渲染之外的更多工,包括大量的通用運算作業。對 GPU 微架構來說,能在單一畫面進行渲染的不同階段中善於混合圖形與運算的工作負荷是很重要的。通過 Furian架構,Imagination 再次以其深厚的 GPU 專業技術積澱,打造出一個專為支援這些下一代應用的完美架構。”
Imagination 公司 PowerVR 事業部執行副總裁 Mark Dickinson 表示:“我們開發 Furian架構 就是為了應對新型態的新興應用,並專注於有效的可擴展性,從而擴展至好幾代的 PowerVR IP 內核。我們非常興奮能開始推出第一款以 Furian 架構為基礎的 8XT IP 內核。這些內核將進一步強化 PowerVR 在高端移動性能領域的領導地位。”

Furian 架構的重要特性

Furian 架構採用了多項使 PowerVR 得以建立技術領先地位的優異特性,包括 Imagination 的分塊式延遲渲染 (TBDR) 技術,它已在多款的 PowerVR GPU 上獲得證明,可提供最高效率的嵌入式圖形功能。

Furian 是專為以下特性所設計:

• 多重性能可擴展性:Furian允許多種方式來進行擴展,是專為達成最高效率的內核利用率與性能密度所設計,以滿足各種市場與需求。針對低級與高級IP內核的不同設計,無需因擴展性能而採取折衷的設計。
• 能夠在SoC與系統的層級進行輕鬆的整合:Furian已針對新的14nm以下制程進行了簡易佈局的最佳化設計,因此能減少佈局的時間與資源,並能更輕鬆地擴展至更高的性能點。
• 功能可延展性:Furian的設計方式能讓未來的特定功能流水線與GPU緊密集成,因而能提供那些以傳統CPU/GPU/DSP方式實現起來成本太高甚至不可行的功能,例如光線追蹤功能。
• GPU 運算:Furian是專為滿足多種應用與市場日益提升的運算需求所設計,能夠高效率地使用多種運算API包括 OpenCL® 2.0、Vulkan® 1.0 和 OpenVX 1.1* 等。Furian 增加了雙向的 GPU/CPU 一致性介面,可彼此有效地分享資料;並從核心模式序列轉移至使用者模式序列,能在執行運算時降低延遲和 CPU 的使用率。
重要的是,Furian 採用新的32寬 (32-wide) ALU 集簇設計,以提升性能密度與效率。在主要與次要的 ALU 管線中使用的新增指令集架構 (ISA) 可實現更佳的資源利用率與效率,而多執行緒優化設計更高效和靈活地訪問片上本地運算記憶體。

Furian的性能資料

性能密度、GPU效率、以及系統效率的提升可為下一代應用提供更低功耗與更佳用戶體驗。與採用相同制程技術的 Series7XT Plus GPU 相比,具備類似晶片面積預算的內核在相同的時間效率下,Furian 可達到:
• 提升35%的GFLOPS密度,提供更佳的運算與遊戲性能效率
• 提升80%的填充率密度,提供更佳的UI與休閒遊戲 (casual gaming) 的性能效率
• 提升70-90%的遊戲精度 ─ 真實世界應用的結果甚至比預期的更高

供應情況
Imagination 已經以初期的 RTL 形式提供首款 Furian IP 內核授權多家合作夥伴。以 Furian 架構為基礎的第一款 GPU 內核衍生版本將於2017年年中發佈。更多資訊,請聯繫 [email protected]

關於 PowerVR GPU
PowerVR 圖形處理器 (GPU) 產品在技術性能、產品路徑以及生態系統方面均是市場的領導者,已為移動與嵌入式GPU樹立了業界標竿。憑藉先進且獨特的架構,PowerVR 成為領先的圖形技術。運用分塊式延遲渲染 (TBDR) 技術,PowerVR 的效率可確保最低的頻寬使用以及單位任務的處理週期最低,因而可實現優異的性能效率以及單位架構的最低功耗,表現優於其他的解決方案。通過採用內置PowerVR 技術的晶片,OEM 廠商可將此優勢帶到其產品中,以提供最傑出的視覺體驗以及最長的電池壽命。

TOP

本帖最後由 C.K.F. 於 2017-3-11 21:13 編輯

The Imagination piece does say it's already licensed by multiple customers. Given the many indication that Apple are doing a lot of graphics work themselves, and Apple is still by far the single biggest Imagination money provider, one can easily conclude that many of the changes in "Furian" would be an Apple's request. For example the highlighted ability to "plug-in" function specific hardware and integrate tightly with the GPU, would allow add-on functionality as/when Apple decide it's feasible to put into the GPU block.

The Anandtech piece states that Imagination "Furian" cores might just be seen in end-user products tale-end of 2018

So that means that for this years iPhone 8 will have:-

a) Same as last year, with a higher clock faciliated by going to a 10nm process
b) Rework of existing IP.
c) Apple may have already gotten the plans for "Furian", and are designing their own specific graphic IP around it. Although designed on the "Furian" IP, these would not be Imagination cores, in that they would not be built on cores that Imagination have designed for customers, hence being consistent with the Anandtech statement.

Interested to know who the other customer is, who has already had some early deliverables.  Samsung??

TOP

相關文章