這就是下代 iPhone / iPad 的 GPU? PowerVR 7 正式發表!

http://www.imgtec.com/news/detail.asp?ID=933



The PowerVR Series7XT family provides an important feature upgrade over Series6XT, bringing new levels of performance to apps, games and GPU compute applications.

PowerVR Series7XT GPUs offer the right mix of performance and features, offering a solution that hits the sweet spot for high-end to mainstream platforms targeting Android 5.0 Lollipop and AEP (Android Extension Pack) support. The main highlights include:
•Industry-leading performance: PowerVR Series7XT GPUs deliver unrivalled performance per mW. For example, PowerVR GT7900 includes 16 clusters and 512 ALU cores, delivering more than 1 TFLOPS graphics and compute performance in FP16 mode.

PowerVR Series7XT GPUs are up to 60% faster clock for clock, cluster for cluster compared to how Series6XT counterparts perform in graphics benchmarks.
•Improved overall efficiency: our new co-issue mechanism makes better use of existing resources and delivers significant improvements in PPA (performance, power, area).
•Virtualization support, a key enabler for improving overall system security and robustness in mobile, automotive and other embedded applications
•Hardware tessellation: we’ve added tessellation hardware to ensure users have access to an unbeatable PC-class gaming experience on AEP (Android Extension Pack) devices. On top of that, we continue to support geometry and compute shaders as well as ASTC LDR and HDR texture compression formats
•Optional DirectX 11 support: we deliver the best PPA support for desktop PC-class devices running Microsoft Windows
•Optional HPC support for High Performance Compute (HPC) and supercomputing applications which require a variable amount of FP64 and OpenCL™ 1.2 Full Profile capabilities.

All these new added hardware capabilities ensure we have the right functionality required to support the latest feature set of the most popular graphics and compute APIs, including OpenGL® ES 3.1 + AEP, OpenGL® 4.4, OpenCL 1.2 FP, RenderScript, and DirectX 11.

Desktop-class performance

The performance increase mentioned above is enabled by our versatile scaling capabilities; the new GPUs scale from two to sixteen shading clusters, giving developers the extra ALU horsepower they need to achieve more realistic effects, more complex pixel shaders, and console-quality lighting in games.
•PowerVR GT7200: 2 shading clusters, 64 ALU cores

•PowerVR GT7400: 4 shading clusters, 128 ALU cores

•PowerVR GT7600: 6 shading clusters, 192 ALU cores
•PowerVR GT7800: 8 shading clusters, 256 ALU cores

•PowerVR GT7900: 16 shading clusters, 512 ALU cores


This unprecedented level of performance offers developers the chance to implement console-quality effects like HDR rendering, realistic 4K texturing, physically-based shading in mobile applications. The animation below illustrates the level of realism that PowerVR Rogue GPUs offer for mobile graphics.

While the number of FP32 and FP16 slots remains unchanged from Series6XT, we’ve added an optional FP64 ALU for every pipeline to ensure developers have access to every type of precision and computing resources when needed:
•FP16 is still widely used in mobile applications, offering sufficient accuracy at lower power.
•FP32 ALUs can be used when a higher rendering precision is required
•FP64 can be added to designs which are used in high-end supercomputing-style applications.

You can find the full specs for every member of the Series7XT family here.

GT7900勁過R7 250

TOP

作為對ARM Mali-T800系列的直接回應,Imagination今天正式發佈了新一代移動GPU PowerVR Series7系列,包括高端7XT、低端7XE兩個子系列。
下邊,我們就細細看看它的底層架構設計,並預覽一下性能。


【PowerVR 7架構解析】
本質上來說,PowerVR 7的架構還是“Rogue”,已經引入兩年。該架構有著先進的著色器流水線體系,沒什麼明顯缺點,短期內還無需徹底翻新,只要局部增強、完善就可以提升效率和性能了,包括強化指令集。



當然,它還需要不斷加入新的功能特性,尤其是新的API。OpenGL ES 3.1早就支持了,但是蘋果的Metal來勢洶洶,作為回擊的Google Android Extension Pack現在是不能少的,還加入了可選項Direct3D 11.1(通俗地說就是DX11.1)。
但是注意7XT上這兩個都是標配,7XE上的AEP只是可選項,Direct3D則只到10.0。


這次唯一增加的新模組就是“曲面細分輔助處理器”(Tessellation Co-Processor),可配合頂點資料管理器(Vertex Data Master)實現完整的曲面細分支持,但注意為了節省功耗,它是個固定功能單元,不可程式設計。
曲面細分、ATSC紋理壓縮、幾何著色、紋理著色,這些就是支持AEP的基礎。
其他模組沒有大變但都有所增強,比如說頂點資料管理器(幾何前端)的幾何性能翻了一番,計算資料管理器(Compute Data Master)則提速了最多三倍,尤其適合處理大量的小內核。
粗紋理調度器(Coarse Grain Scheduler)降低了內部區塊關聯性,可以更快地向空閒核心(著色器簇/USC)發送指令,而不必等待其他核心完成工作。


USC核心本身變動很小,FP16/FP32 ALU、浮點單元都沒變,但是特殊功能單元(SFU)有了兩處明顯變化。首先也是最重要的,SFU可以原生處理FP16、FP32操作了(上代會全部推給FP32),因此在處理FP16資料集的時候不必進行無謂的高精度操作,自然能節省功耗,而且因為SFU本身已經很大了,原生FP16帶來的功耗節約會很明顯。
另外雖未明說,但極有可能FP16、FP32 SFU單元已經分離成了獨立的兩個(架構圖顯示一個),當然即便如此它們也不能同時使用。
第二個增強是SFU操作可以和ALU操作併發了,也就意味著兩個單元可以同時工作。Imagination表示,SFU代碼比預期得來得更快,因此併發會大大提高性能,為此指令集也做了相應的擴展。
此外,PowerVR 7系列還可選支援FP64操作,按照設計每核心有一個FP64 ALU。


最後是個非圖形功能,硬體加密區,使用虛擬化技術創建最多8個區域,彼此完全隔離,可進行不同的安全操作,並與CPU、GPU互聯。7XT會標配它,7XE上則是可選。
CPU上早就有了類似的功能,GPU上則一直是軟體類比,效率低下,而且安全性不足。

TOP

【7XT/7XE:高低雙雄細節探究】
7XT是高端型號,但也有很多技術特性是可選的。FP64操作、OpenCL 1.2 Full Profile是面向高性能計算用途的(默認僅支援FP32、OpenCL 1.2 Embedded Profile),Direct3D 11則適合Windows Phone、Windows RT平臺設備(預設是Direct3D 10),但是曲面細分已經是標配。
通過靈活配置這些特性,SoC廠商可以精確滿足自己和客戶的需要,同時更好地控制面積和功耗。


其實相比於性能,能效才是7XT系列提升的重點。Imagination沒有給出任何具體資料(提升了百分之多少),只是說7XT可以更低的功耗提供與6XT持平的性能,同時給了一張幻燈片,號稱自己有著全球最高的GPU能效。
證據就是自己的PowerVR長時間運行也幾乎不會降頻,競爭對手的則會降低40-60%。
當然了,這能否實現還得看SoC廠商的設計,Imagination只能提供最基本的建議。人家非要把CPU、GPU頻率弄得很高,跑著跑著就會過熱降頻,你也沒轍。



7XT系列的核心可選2-16個,比上代最多翻了一番,具體型號分別是:雙核心GT7200、四核心GT7400、六核心GT7600、八核心GT7800、十六核心GT7900。
很有意思的命名吧?Imagination甚至說GT7900的性能已經可以超越入門級筆記本獨顯GeForce GT730M。GT7400/GT7600則是上代主機Xbox 360、PS3的水準。
用途方面,2-4個核心的適合手機,6-8個可用於平板機、汽車、超極本,16個的只有筆記本、機上盒、遊戲機、伺服器才敢用——512個FP32 ALU單元差不多可以媲美入門級桌面獨立顯卡了。
目前的6XT系列裡,iPhone 6用到的GX6450是四個核心,iPad Air 2裡的GX6650旗艦型號六個核心。


7XE定位於入門級,規格、成本都很低,並且更強調面積上的效率,而不是功耗。


7XE其實也有著7XT相同的架構改進,可以支援7XT的幾乎所有技術,但絕大部分都是可選項,包括DirectX 11、曲面細分(AEP自然也是可選了)、紋理壓縮、HEVC/H.265解碼、10-bit YUV色彩輸出、虛擬化安全。OpenCL 1.2 FP都直接不可選。



7XE有兩個版本,一個核心的GE7800面向低端手機和電視,半個核心的GE7400則面向最便宜、最簡單的設備,以及可穿戴設備。
Imagination聲稱,7XE的功耗滿載也不會超過1W,待機時幾乎可以忽略不計。

TOP

【性能怎樣?】
真正使用PowerVR 7系列的處理器、設備要明年底才會出現,而我們都知道,ARM、Imagination他們都只是賣CPU、GPU授權,具體什麼樣子還得看SoC晶片廠商的選擇,包括核心數量、技術特性、製造工藝、運行頻率等等,因此現在是無法說清性能的,只能有一個大概的預估。


Imagination宣稱,在同樣核心數量、同等頻率下,7XT系列的性能可比6XT系列提升達60%,如果真能實現是很猛的,但這也意味著功耗會增加很多,因此最終在考慮功耗的前提下,性能提升絕對不會這麼高,而且這只是理論測試,實際應用中又會打個折扣。


而在能效方面站出來的是7XE,官方號稱相比6XE提升幅度少則40%,多則可以超過100%。
結語:
PowerVR 7系列可以配置出各種不同的版本,最高最低相差32倍,因此理論上適合各種各樣的設備,從智慧手錶、手環到筆記本甚至是伺服器計算集群


PowerVR 6系列是CES 2014大展上宣佈的,最近才剛剛投入實用,iPhone 6/Plus、iPad Air 2就是典型代表。PowerVR 7系列的零售產品預計會在一年後面世,正好就是下一代iPhone、iPad發佈的視窗,而按照蘋果與PowerVR的一貫良好合作關係,iPhone 7(6S)幾乎必然會用PowerVR 7,而且說不定會有6個核心。
ARM Mali-T800、高通Adreno 400、NVIDIA麥克斯韋……明年的移動GPU,註定會精彩異常。

TOP

1 TFLOPS
已經有 desktop 入門獨顯的性能

TOP

越出越變態,點解要推多核?

TOP

越出越變態,點解要推多核?
戀人未滿 發表於 2014-11-12 11:36



so they can squeeze out the die area from die shrink and keep the frequency low

TOP

1 TFLOPS
已經有 desktop 入門獨顯的性能
usei 發表於 2014-11-12 11:22

1990的超級電腦先致1 TeraFLOPS

(由 HKEPC Android 手機版 發出)

TOP

GPU咁勁
好心 Apple 就 officially 出一個打機手制
如果可以在 Apple TV 同 ipad (打橫坐枱放) 打機
一定可以搶唔少家用機用家市場

(例如 Winning, FIFA, Street Fighter, Sonic, 羅拉 果d games 要手制先玩到)

TOP