2016-04-07
Pascal 架構提供幾何級效能躍升
NVIDIA Tesla P100 加速器面世
文: Samuel Wong / 新聞中心
文章索引: IT要聞 顯示卡 NVIDIA 其它

NVIDIA 日前發佈 Tesla P100 加速運算平台,其媲美數百個 CPU 伺服器節點運算效能的新一代伺服器,效能足以應付現時巨大的網路基礎架構與眾多互連商用 CPU 伺服器處理網路服務,其 Pascal™ GPU 架構所提供的運算能力更比上代 Maxwell 架構翻倍提升。

 

NVIDIA Pascal 架構 NVIDIA Maxwell 架構的解決方案相比,採用 Pascal 架構的 Tesla P100 解決方案在訓練神經網路方面的效能表現提升了 12 倍。 NVIDIA NVLink 高速 GPU 互連技術將應用程式的運算範圍擴大到多個 GPU 上,頻寬較目前同級最佳解決方案速度提高 5 倍,最多更可互連 8 個 Tesla P100 GPU ,使得單一節點發揮最高應用效能。

 

同時,其採用 16nm FinFET 工藝打造,以 153 億個電晶體提設計提供最高運算速度和最佳省電表現。另外, Pascal 架構加入 Chip on Wafer on Substrate (CoWoS) 記憶體設計技術搭載 HBM2 記憶體,在記憶體頻寬表現方面比 Maxwell 架構提升了 3 倍 ( 每秒 720GB) 。為加強深度學習表現,系統亦擁有 21 TFLOPS 深度學習技術,尖峰運算效能表現大為提高。

 

Tesla P100 GPU 加速器具體規格包括:搭載 NVIDIA GPU BOOST 技術達到 5.3 TFLOPS 雙精度效能、 10.6 TFLOPS 單精度效能、 21.2 TFLOPS 半精度效能的水準並採用 NVIDIA NVLink 技術提供達到每秒 160GB 的雙向互連頻寬,支援 16GB CoWoS HBM2 堆疊記憶體等等, 針對伺服器進行優化,提供最高級資料中心處理量和可靠性。

 

NVIDIA 還宣佈用於深度神經網路的 GPU 加速基本函式庫 cuDNN version 5 。 cuDNN 5 加入支援 Pascal GPU 、加快用於視訊和順序數據之遞迴神經網路的運算速度,以及額外加強在醫療、石油天然氣等產業的使用情況。

 

全新 NVIDIA DGX-1 深度學習系統內採用 Pascal 架構的 NVIDIA Tesla P100 GPU 加速器將於 6 月上市。

 

NVIDIA DGX-1

發表評論