2014-03-26
NVIDIA GTC 2014大會發佈"Titan Z"
次世代「Pascal」GPU微架構原型曝光
文: John Lam / 新聞中心

NVIDIA 25 日於美國 San Jose 舉行 GTC 2014 大會,執行長 Jensen Huang 展示透露了 NVIDIA 未來技術發展方向,會上展示了協助開發者推出基於 Tegra K1 處理器產品的「 Jetson TK1 」開發套件,並透露將於 2015 年推出次世代 Tegra 處理器代號「 Erista 」, 2016 年將推出全新「 Pascal 」 GPU 微架構,加入大 NV Link 和 Un 。此外, NVIDIA 亦在會場中正式發佈全新 NVIDIA GeForce GTX Titan Z 繪圖卡,內建 5,760 CUDA Cores 、 12GB GDDR5 記憶體、高達 8 TeraFLOPS 運算能力,但售價高達 $2,999 美元。

 

NVIDIA Tegra 產品線發展

 

NVIDIA 執行長 Jensen Huang 於主題演說中表示,嵌入式系統將會是 NVIDIA 未來成長動力的主要來源, NVIDIA 看來機器人、醫療、航空電子、汽車領域等市場將會進入電腦視覺、影像處理和即時資料處理的運算時代,為了令開發者能減低基於 NVIDIA Tegra K1 處理器所需的成本和時間, NVIDIA 宣佈推出「 NVIDIA Jetson TK1 」開發套件,為開發商提供新一代系統和應用所需的開發工具。

 

GTC
NVIDIA 執行長展示「 NVIDIA Jetson TK1 」開發套件

 

「 NVIDIA Jetson TK1 」開發套件是基於今年美國 CES 發佈的全新 Tegra K1 處理器, 4 個 CPU Cores 並配置 192 個 CUDA GPU Cores ,提供 326 Gigaflops 浮點運算效能,其強勁效能比類似的嵌入式平台多 3 倍以上,並且附連 CUDA 6.0 平行運算的 C/C++ 套件,相較目前其他公司提供的 FPGA 、客制化 ASIC 或 DSP 處理器更容易進行編程。

 

GTC
GeForce 與 Tegra 產品線未來將會共用 GPU 微架構

 

Jensen Huang 指出, Tegra 處理器在 Tegra 3 、 Tegra 4 世代採用 Mobile GPU 架構, NVIDIA Tegra K1 處理器將會是一個新里程,其 GPU 架構將會與 GeForce GPU 統一,借助 CUDA 平衡運算能力其能源性能比表現相較 Cortex-A15 處理器高出 4X ,今代 NVIDIA Tegra K1 處理器正是基於 NVIDIA Kepler GPU 微架構。 Jensen Huang 透露 2015 年推出基於全新 NVIDIA Maxwell GPU 微架構的 Tegra 處理器,核心代號為「 Erista 」。

 

GTC
NVIDIA 公佈 Tegra 處理器開發路線圖,代號「 Erista 」的次世代處理器將基於 Maxwell GPU 微架構

 

NVIDIA GeForce 產品線發展

 

NVIDIA GTC 2014 大會上, Jensen Huang 宣佈推出全新「 GeForce GTX Titan Z 」 Dual GPU 繪圖卡,它是基於兩顆 28nm 制程 GK110 B1 Stepping 繪圖核心,合共內建 5,760 個 CUDA Cores ,卡載高達 12GB GDDR5 記憶體,提供 8 TeraFLOPS 運算性能,不過定價高達 $2,999 美元天價,並且主要針對遊戲玩家市場,而是偏向要求高速雙精度運算的工作站應用。

 

GTC
NVIDIA 正式發佈 GeForce GTX Titan Z ,雙 GPU 架構高達 5760 CUDA Core
Titan ZTitan Z


Jensen Huang 談及 NVIDIA GPU 微架構發展路向, NVIDIA 於今年初發佈 NVIDIA Maxwell GPU 微架構,其微架構的設計重點是強化對 DirectX 12 API 運算,不過 GTC 2014 大會並沒有對 Maxwell 及後發展著作出預告,反而是對緊接於 2016 年推出的次世代 GPU 微架構「 Pascal 」作出了大量的描述。

 

NVIDIA 「 Pascal 」 GPU 微架構的其中一個重大改良是加入了全新的「 NV Link 」技術,這是由 NVIDIA 與 IBM 共同研發的互聯技術,預期可讓 GPU 和 CPU 分享資料的速度比目前快 5 至 12 倍,並且解決長久以來 GPU 和 CPU 之間資料傳輸的瓶頸,有助發展比目前最強大的系統快 50 至 100 倍的新一代 exascale 級超級電腦。

 

NV Link 加速 CPU 、 GPU 資源交換速度

 

GTC

 

NV Link 技術主要是加速 CPU 與 GPU 之間的資料交換速度,從而提升系統資料處理吞吐量,其設計將優於現時應用於 x86 架構的 PCI Express 3.0 繪圖介面,它限制了 GPU 對 CPU 記憶體系統的存取能力, PCI-Express 甚至可說是 GPU 與 CPU 之間的重大瓶頸, NV Link 可以讓 GPU 以最直接的方式存取 CPU 記憶體。

 

由於 GPU 的記憶體速度快但容量小,而 CPU 的記憶體容量大但速度慢,各種加速運算應用通常會將資料從網路或磁碟儲存移到 CPU 記億體,然後會在資料被 GPU 處理前將資料複製到 GPU 記憶體,但 NV Link 能夠加速 CPU 與 GPU 之間的資料傳輸速度。

 

Unified Memory 統一記憶體技術

 

為更快的資料傳輸速度, NVIDIA 在「 Pascal 」 GPU 微架構進一步加入統一記憶體 (Unified Memory) 技術,此舉可簡化 GPU 平行運算編程,開發者只需把 CPU 與 GPU 視為同一個記憶體區塊,無需顧慮資料究竟是在 CPU 或 GPU 的記憶體中。

 

NVIDIA 未來的 GPU 仍舊支援 PCI-Express 介面,但會加入 NVLink 技術配合支援 NVLink 技術的 CPU ,並可令 Multi GPU 架構提供更直接的高頻寬連結,現時已得悉 IBM 將會於下代 POWER CPU 中整合 NV Link 技術支援。

 

GTC
NVIDIA 展示未來「 Pascal 」 GPU 微架構的 NV Link 設計原型

 

Jensen Huang 展示了採用基於 NVIDIA 「 Pascal 」 GPU 微架構並支援 NV Link 技術的原型,其原型模組的體積只有現今 GPU 使用的 PCI-Express 繪圖卡的三分之一,透過 Pascal 模組底部的連接器,該模組可以直接與主機板連接,提升系統設計和訊號完整度。

 

預期採用 NVLink 高速互聯技術可實現高度連結的系統,有助高度節能和擴充式的 exascale 級超級電腦之發展,這些超級電腦的執行速度高達 1,000 petaflop ( 每秒可達 1 x 1018 浮點運算 ) ,或者比目前最快的超級電腦快 50 至 100 倍。

發表評論