2015-03-23
讓深度學習應用程式運算速度加快十倍
NVIDIA 下一代 Pascal GPU 預計於明年推出
文: Cherry Kwok / 新聞中心
文章索引: IT要聞 顯示卡 NVIDIA

NVIDIA 於美國矽谷舉辦的 GTC 2015 大會上,率先揭露明年推出的 Pascal 架構,相較於當前的 Maxwell 處理器, Pascal 架構 GPU 將可能可讓應用程式的運算速度加快十倍。

 

GTC 2015 大會由 NVIDIA 執行長暨共同創辦人黃仁勳先生進行開幕主題演講,並對四千名與會嘉賓揭露 Pascal 架構的細節與處理器的最新發展藍圖。 Pascal 架構 GPU 的三大設計特色將大幅加快訓練速度,加上 32GB 的記憶體 ( 是剛發表 NVIDIA 旗艦級繪圖卡 GeForce GTX TITAN X 的 2.7 倍 ) , Pascal 架構可進行混合精密的運算作業。它將配備 3D 記憶體,提升深度學習應用程式的速度效能多達 5 倍,另搭配 NVIDIA 的高速互連技術 NVLink 來連接兩個以上的 GPU ,可將深度學習的速度效能提升達十倍。

 

混合精密運算技術讓採用 Pascal 架構的 GPU 能以 16 位元浮點運算兩倍精準度的 32 位元浮點運算精準度進行運算。記憶體頻寬方面的限制局限了將資料傳到 GPU 的速度,採用 3D 記憶體將可提高比 Maxwell 架構高出三倍的頻寬和近三倍的記憶體容量,讓開發人員能建立更大的網路,加快深度學習訓練需使用大量頻寬部分的運算速度。

 

Pascal 架構將相疊的記憶體晶片放在 GPU 旁邊,而非放在處理器機板下方,此舉能把資料在記憶體與 GPU 間往返的距離從幾英吋減縮到幾公釐,大幅加快傳遞速度和擁有更佳的省電表現。

 

同時, Pascal 架構加入 NVLink 技術將使得 GPU 與 CPU 間資料移動的速度,較現有的 PCI-Express 標準加快 5 到 12 倍。 NVLink 可將系統裡的 GPU 數量增加一倍,以共同用於深度學習運算作業上,還能以新的方式連接 CPU 與 GPU ,在伺服器設計方面提供較 PCI-E 規格更佳的彈性和省電表現。

 

黃仁勳表示, NVIDIA 研發部門在過去三年間不斷精鍊,讓 NVIDIA 從中受惠十億美元。 Pascal 架構 GPU 相較 Maxwell 處理器,將使深度學習應用程式的運算速度加快十倍,並預計於明年推出。

 

NVIDIA GTC 2015

 

發表評論