Imagination推出IMG CXT圖形處理器:手機將實現硬體光線追蹤

Imagination推出IMG CXT圖形處理器:手機將實現硬體光線追蹤

對於如今的移動設備來說,圖形處理器(GPU)是不可或缺的一部分,遊戲、視頻、VR、AR等場景都需要圖形運算能力的支撐。不過,目前只有為數不多的企業能夠設計GPU,Imagination Technologies則是其中之一,不僅推出了知名度很高的PowerVR系列,還將硬體光線追蹤技術帶到了移動領域。
11月4日,Imagination Technologies正式宣佈推出IMG CXT,一款全新的旗艦級GPU智慧財產權(IP)產品,同時亮相的還有光線追蹤架構PowerVR Photon。Imagination Technologies表示,該架構不同於目前移動端的軟體光追方案,基於硬體實現,稱得上GPU IP領域的又一次重大飛躍。
不同於目前普遍使用的光柵渲染,光線追蹤渲染技術可以通過演算法類比出接近真實光線軌跡,從而讓3D畫面變得非常真實,尤其是光影表現幾乎完全接近現實生活中的效果。但是,由於光線追蹤需要大量的計算資源,只有桌面級PC、遊戲主機才能實現即時光線追蹤,並且僅限於近幾年發佈的中高端產品,移動端一直沒有高效的解決方案。

隨著IMG CXT和PowerVR Photon架構的出現,這一局面將被打破。其中,IMG CXT-48-1536 RT3內核具有三個光線加速集群(RAC),可提供總體高達1.3 GRay/s的性能,即使在移動設備低功耗的情況下,也能以1080P解析度實現30~60FPS的光線追蹤渲染,滿足日常遊戲所需。
值得一提的是,由於光線追蹤能在不同的性能和效率等級下執行,Imagination Technologies為了讓玩家、開發者瞭解這一點,建立了光線追蹤等級系統(RTLS),從0級到5級共6個等級的光線追蹤功能的要求。此次,新推出的PowerVR Photon架構已經屬於RTLS 4級,遠高於現在已經出現的軟體光線追蹤解決方案。

Imagination Technologies表示,PowerVR Photon架構之所以能夠實現高級別的光線追蹤,是因為加入了RAC單元。這是一種專門針對光線追蹤運算的硬體結構,具有光線存儲(Ray Store)、光線任務調度器(Ray Task Scheduler)和相干性聚集器(Coherency Gatherer)等,並與兩個128位寬的統一著色器集群(USC)緊密耦合,同時USC擁有高速專用資料通路,可以在低功耗的情況下加速光線追蹤計算。

此外,除了光線追蹤技術,IMG CXT在傳統的光柵渲染方面也有提升,與Imagination Technologies的上一代GPU IP相比,其計算、紋理和幾何性能都提高了50%,並具有圖像壓縮(IMGIC)技術等,提供了卓越的幀率功耗比(FPS/W)效率。

至於未來的實際運用,Imagination Technologies已在多個市場中進行了授權,同時獲得了相關行業及眾多企業的積極評價。另外,得益於多核技術,Photon架構可實現高達9TFLOPS的FP32光柵化性能和超過7.8 GRay/s的光線追蹤性能,同時提供高於RTLS 2級(如AMD 的RDNA2)或3級(如NV的 Ampere)光線追蹤方案2.5倍的功耗效率。使得Photon架構除了遊戲領域,也可擴展應用於雲、資料中心、PC市場,以及汽車領域,包括高品質的汽車人機界面(HMI)、具備混合現實功能的抬頭顯示器(HUD)、數位車速表和其他資訊顯示器等。

正如前文所說,IMG CXT、PowerVR Photon光線追蹤架構的推出稱得上GPU IP領域的又一次重大飛躍,新品不僅擁有業內為數不多的硬體即時光線追蹤技術,同時還面向移動領域,帶來了低功耗優勢。我們完全有理由相信,未來隨著IMG CXT、PowerVR Photon光線追蹤架構的實際應用,將徹底改變移動設備的遊戲視覺體驗。

提示: 作者被禁止或刪除 內容自動屏蔽

TOP

提示: 作者被禁止或刪除 內容自動屏蔽

TOP

據聞 Apple已經授權咗呢項技術, 因此相信好可能會在下一代 Apple Silicon中使用.

TOP

光線係最費資源, 但用戶感受唔大既一項技術
手機都玩光追都唔知係咪好事, 得果幾吋都唔知感受到D咩

TOP

光線係最費資源, 但用戶感受唔大既一項技術
手機都玩光追都唔知係咪好事, 得果幾吋都唔知感受到D咩  ...
rabbit82047 發表於 2021-11-11 10:36


硬體光追加速主要得益是減開發成本

TOP

Imagination 的 Ray Tracing技術應該係最勁, 專利亦係最多, 所以好值得期待.

TOP

提示: 作者被禁止或刪除 內容自動屏蔽

TOP

硬體級光線追蹤:移動遊戲圖形的變革時刻

作者:Kristof Beets,Imagination Technologies技術前瞻副總裁

在即時計算生成的圖形中實現真實感的關鍵是照明。光柵化——傳統渲染 3D 圖形的方式,並不是類比真實光和陰影的最佳技術。它需要大量的計算資源和複雜的開發技術,結果仍然不理想。

相反,電影動畫師使用光線追蹤技術來創建全域照明、陰影和反射等效果。光線追蹤可以精確且輕鬆地模擬光線的行為,從而生成一個更逼真的場景,而所需的工作量更少。

然而,為了在遊戲中獲得真正的沉浸式體驗,光線追蹤必須即時完成,圖像渲染只需要幾秒鐘。這使得它在處理計算和資源耗費方面成本昂貴,令人望而卻步。雖然現有硬體可以在PC和遊戲主機實現即時光線追蹤效果,但我們需要權衡性能、功耗和面積等各個方面,所以光線追蹤選擇性用於僅照亮場景中最重要的物件。在某些情況下,使用者可以決定如何,以及是否使用光線追蹤。

這些權衡使得在電源受限的設備中實施即時光線追蹤極具挑戰性,因此該技術尚未用於移動平臺。不過,據有關資料顯示,移動遊戲很快將佔據全球遊戲市場的52%(NewZoo,2021年),移動遊戲的體驗成為未來發展不容忽視的方向。

移動圖形

儘管在尚未出現光線追蹤前,移動平臺上的圖形品質一直在穩步提高。但是,使用傳統技術製作越來越逼真的圖形變得愈加複雜,這正在將性能、功耗和頻寬推向移動處理器的極限。

例如生成陰影,傳統上使用級聯陰影貼圖(CSM, Cascaded shadow maps)完成。這個過程需要大量的幾何處理,分配大量的緩衝區,多個高解析度渲染目標的處理,以及昂貴的著色器操作。在經歷了所有過程、功耗和頻寬使用後,結果仍然不如使用光線追蹤那麼真實。

在光線追蹤中不存在許多假圖、解析度問題和其他與傳統光柵化有關的問題。通過光線追蹤,光線從單個圖元出發到達光源。如果光線擊中某物,則該區域就處於陰影之中。每個圖元一條光線,這很直接,且成本較低,特別是對於高效實現的專用硬體。

今天,我們使用陰影貼圖等技術做近似處理代價較高,是以即時光線追蹤正成為一種更高效的選擇。而且,我們不能再依賴每兩年的呈指數級增長的可程式設計硬體,因此高效設計固定功能的硬體加速器來推進光線追蹤技術,成為必須,尤其是對於功耗受限的平臺。

當前的光線追蹤硬體

光線追蹤可以以不同的性能和效率水準進行分級。為了闡明這一點,Imagination建立了光線追蹤等級系統(RTLS),確定將其分為從0級到5級的六個級別。

早期硬體加速光線追蹤的嘗試並不是最優的。這些傳統解決方案——我們稱之為 RTLS 級的"0 級" ——功能有限,需要定制應用程式設計發展介面(API)和硬體。然後,市場發展到基於傳統 GPU 的"1級" 軟體計算解決方案。這些解決方案更加靈活,但仍遠遠不夠理想。

今天,大多數光線追蹤解決方案(例如用於PC和遊戲主機)是 "2 級" RTLS解決方案。他們有專門的硬體,用於最基本的光線追蹤操作:針對三角形/盒的交集測試器。將此操作放在固定功能硬體中可以實現更高的能效,但仍然會將多個級別的光線追蹤處理運行在 GPU 上的shader,這些處理階段對GPU的並存執行引擎並不友好。這還導致傳統圖形性能和算數邏輯單位(ALU)管線效率降低,從而限制了總體輸送量。

"3級" RTLS 解決方案在專用硬體中集成了更多的光線追蹤功能,包括通過遍歷光線追蹤的主要資料結構(邊界體積層次結構(BVH)進行完整的光線相交處理。這將提高更複雜場景的光線追蹤效率,更好地轉移光線追蹤功能,並減少對傳統圖形性能的影響。但是,3 級解決方案缺乏一個基本元件:一致性排序。沒有這一點,GPU的許多並行性優勢就會喪失。

當今最先進的 PC 和遊戲主機解決方案是 RTLS 級中的 3 級解決方案,雖然它們可能聲稱每秒有高達千兆的光線數,但效率很低,與GPU 處理資源利用率低或記憶體訪問限制有關,這是由於光線在整個場景中散射造成的非相干的記憶體訪問模式造成的。

為了使光線追蹤在移動設備中工作,我們必須利用 GPU 中固有的並行性,並開發優化硬體的智慧演算法。

用於光線追蹤的智慧硬體

Imagination在移動 GPU 方面的輝煌傳統——為超過100 億設備提供圖形——意味著我們知道如何在高效硬體中提供令人驚歎的圖形。現在我們提供的光線追蹤,可達到RTLS級別的4級。

在第4級,BVH光線遍歷是在使專用硬體中完成的(如第3級),但重要的是,光線相干性排序也是如此,它將沿同一方向移動的光線分組,以充分利用GPU的平行計算能力。與基於分塊的渲染類似,它通過空間局部性分塊排序提高了效率,光線的相干性排序提高了ALU的總體使用率,並顯著提高了測試效率。而且,由於我們幾乎將光線追蹤處理負載完全轉移到專用硬體中,因此對傳統圖形性能的影響最小。

4 級的實現將很快通過Imagination的光線追蹤IP(IMG CXT)提供。使用 CXT,公司可以構建高達9 TFLOPS 的 FP32 光照性能和超過 7.2G光線/秒的光線追蹤性能,同時提供比 2 級和 3 級解決方案高達 2.5 倍的功耗效率。

當然,最高效的硬體依然對實現最佳的移動圖形品質具有極大説明,我們在開發人員網站上詳細介紹了許多技術,以説明開發人員從硬體中獲得最大的收益。

通過我們新的高效硬體,我們正在為移動設備實現即時光線追蹤。這是一個真正的遊戲規則改變者。它將把世界上最龐大的遊戲玩家群體帶向開發者,為移動設備製造商提供一種新的差異化方式,並實現全新的沉浸式移動用戶體驗。

TOP