NVIDIA 下一代 Pascal GPU 預計於明年推出
NVIDIA 於美國矽谷舉辦的 GTC 2015 大會上,率先揭露明年推出的 Pascal 架構,相較於當前的 Maxwell 處理器, Pascal 架構 GPU 將可能可讓應用程式的運算速度加快十倍。
GTC 2015 大會由 NVIDIA 執行長暨共同創辦人黃仁勳先生進行開幕主題演講,並對四千名與會嘉賓揭露 Pascal 架構的細節與處理器的最新發展藍圖。 Pascal 架構 GPU 的三大設計特色將大幅加快訓練速度,加上 32GB 的記憶體 ( 是剛發表 NVIDIA 旗艦級繪圖卡 GeForce GTX TITAN X 的 2.7 倍 ) , Pascal 架構可進行混合精密的運算作業。它將配備 3D 記憶體,提升深度學習應用程式的速度效能多達 5 倍,另搭配 NVIDIA 的高速互連技術 NVLink 來連接兩個以上的 GPU ,可將深度學習的速度效能提升達十倍。
混合精密運算技術讓採用 Pascal 架構的 GPU 能以 16 位元浮點運算兩倍精準度的 32 位元浮點運算精準度進行運算。記憶體頻寬方面的限制局限了將資料傳到 GPU 的速度,採用 3D 記憶體將可提高比 Maxwell 架構高出三倍的頻寬和近三倍的記憶體容量,讓開發人員能建立更大的網路,加快深度學習訓練需使用大量頻寬部分的運算速度。
Pascal 架構將相疊的記憶體晶片放在 GPU 旁邊,而非放在處理器機板下方,此舉能把資料在記憶體與 GPU 間往返的距離從幾英吋減縮到幾公釐,大幅加快傳遞速度和擁有更佳的省電表現。
同時, Pascal 架構加入 NVLink 技術將使得 GPU 與 CPU 間資料移動的速度,較現有的 PCI-Express 標準加快 5 到 12 倍。 NVLink 可將系統裡的 GPU 數量增加一倍,以共同用於深度學習運算作業上,還能以新的方式連接 CPU 與 GPU ,在伺服器設計方面提供較 PCI-E 規格更佳的彈性和省電表現。
黃仁勳表示, NVIDIA 研發部門在過去三年間不斷精鍊,讓 NVIDIA 從中受惠十億美元。 Pascal 架構 GPU 相較 Maxwell 處理器,將使深度學習應用程式的運算速度加快十倍,並預計於明年推出。