2016-05-24
全新Pascal GPU微架構
NVIDIA GeForce GTX 1080登場
文: John Lam / 評測中心


NVIDIA 正式發佈新一代「 Pascal 」 GPU 微架構高階繪圖卡「 GeForce GTX 1080 」,基於全新 16nm FinFET 制程的「 GP104 」繪圖核心,高達 72 億個電晶體、內建 2560 個 CUDA Cores ,加入全新 Simulataneous Multi-Projection(SMP) 技術,更是業界首款繪圖卡採用全新 GDDR5X 記憶體,無論在效能、記憶體頻寬、以及能源效率等方面,均比前一代高效能「 Maxwell 」 GPU 架構大幅躍進,尤其在 VR 遊戲性能表現將有突破性提升。



加入 Dynamic Load Balancing 運算

 

除了在半導體層面的改良,「 Pascal 」 GPU 微架構亦針對異步運算作出改良,以往 GPU 在同時處理一幀影像的渲染及運算工作時, GPU 需要劃出固定的 CUDA Core 運算核心區間,讓不同類型的工作同時進行,當某一項工作已完成時,相關的 CUDA Core 會變成閒置的運算單元,直至該幀的其他運算完成後才會被重新分配。
  

全新「 Pascal 」 GPU 微架構首次引入了「 Dynamic Load Balancing 」運算,當某一項工作已完成時,相關的 CUDA Core 會立即被分配處理其他工作,加速完成該幀畫面的處理,將有效令 GPU 運算效率大大提升,減少內部運算單元閒置而造成浪費,將有效提升影像及聲音物理運算及渲染後影像處理等的性能。

 

GP104

 

新增 Low-Level Preemption 能力

 

今代「 Pascal 」 GPU 微架構為進一步降低運算延遲,新增了 Pixel Level Preemption 搶佔中斷,遊戲引擎的每一個渲染指令往往包含了數百個 Draw Calls 、每個 Draw Calls 可包括數百個三角形,每個三角可能包括了數百個 Pixel 指令,以往 GPU 必需要完成整個渲染指令,才能切換至執行其他工作,造成嚴重的運算延遲。

 

為解決這個問題,全新「 Pascal 」 GPU 微架構首次引入全新「 Pixel Level Preemption 」功能,在執行一個渲染過程中可以在細微至在某一 Pixel 指令運算期間作出暫停,立即切換至執行其他渲染指令,切換時所需要延遲將少於 100ms ,而被暫停的工作可以暫存在記憶體中,並可以隨時繼續未完成的渲染工作。

 

GP104  

 

除了繪圖層面外,全新「 Pascal 」 GPU 微架構亦加入了「 Instruction Level Preemption 」功能,當 GPU 執行一項運算工作時,可以在指令之間作出暫停,立即切換至其他運算工作,同樣地未完成的工作可暫存至記憶體,並隨時繼續未完成的工作。  

 

透過全新 Pixel Level 和 Thread Level Preemption 運算能力, GPU 能夠提供更快的反應時間,以解決突如其來的指令要求,其中最大得益將會是 VR 應用,當頭部位置突然改變, GPU 能夠立即中斷現有渲染加速更新反應。

 

GP104

分享到:
發表評論