2011-03-01
NVIDIA推出全新CUDA 4.0版本
進一步簡化易用 吸引開發者採用
文: Spike Lam / 新聞中心

NVIDIA 1 日宣佈推出 CUDA 4.0 簡化平行運算編程版本及最新的工具套件,可將平行運算編程變得更容易,讓開發者將應用植入 GPU 內,統一虛擬位址、 GPU 對 GPU 傳輸和加強型 C++ 樣本程式函式庫,期望可吸引更多軟件開發者推出支援 NVIDIA CUDA 技術的程式。

 

據 NVIDIA 表示, CUDA 4.0 主要改良包括 GPU Direct 2.0 技術,可在單一伺服器或工作站中,支援 GPU 對 GPU 的傳輸,這項改良可讓多重 GPU 編程變得容易、快捷,讓 CUDA 技術應用變得更廣泛。

 

此外, NVIDIA 亦回應了開發者對虛擬位址的訴求,可針對主系統記憶體和 GPU 內建記憶體提供單一合併記憶體位址空間,讓平行運算編程變得更快、更容易。

 

Thrust C++ 樣本效能原生程式庫-提供一系列效能強勁的開放原始碼 C++ 平行運算演算法,以及可為 C++ 開發者提供更容易進行編程的資料架構,如平行運算分類等一般作業,透過 Thrust 可比採用標準樣本庫 (STL) 和執行緒結構模組 (TBB) 執行的分類作業快 5 到 100 倍不等。

 

全新 CUDA 4.0 架構還新增 MPI 與 CUDA 應用整合,修正後的 MPI 配置像 OpenMPI 等,可在應用程式送出或接收一個 MPI 指令時,運用 Infiniband 自動將資料在系統與 GPU 記憶體之間傳送。

 

GPU 能執行多重執行緒共享功能,多個 CPU 主執行緒可以在單一的 GPU 中分享各種使用情境,讓多緒應用更容易共用一個 GPU ,而且單一 CPU 執行緒共享多重 GPU ,單一 CPU 主執行緒可以存取所有系統中的 GPU 。開發人員可以針對應用程式內的「 halo 」交換等作業輕鬆地進行協調。

 

提供全新 NPP 影像與電腦視覺函式庫,套提供豐富工具的影像轉換作業,為各種影像和電腦視覺應用提供快速的開發環境,全新改良功能包括在 Visual Profiler 提供自動效能分析;在 cuda-gdb 內提供全新功能,並加入針對 MacOS 作業系統的支援;加入針對新增 / 刪除等 C++ 功能和虛擬功能的支援及全新 GPU 二位元反彙編器。

 

CUDA Toolkit 4.0 版本將於 2011 年 3 月 4 日起,透過 CUDA 註冊開發者計畫免費提供下載, CUDA 註冊開發者計畫,為平行運算應用開發者提供豐富的工具,相信能吸引更多的開發者使用 CUDA 開發軟件。

 

NVIDIA Parallel Nsight

分享到:
發表評論
本篇文章被 17301 人閱讀,共有 個評論