為回應對手新一代高階繪圖卡「 Radeon R9 290X 」, NVIDIA 早前推出「 GeForce GTX 780 Ti 」強勢還擊,卻令原定位最高階 3D 遊戲與運算應用的「 GeForce GTX Titan 」繪圖卡出現性能重疊之尷尬情況。因此, NVIDIA 18 日正式推出全新「 GeForce GTX Titan Black 」繪圖卡取代舊有型號,改用「 GK110 」 B1 Stepping 繪圖核心, CUDA Core 數目提升至 2880 個,搭載 6GB GDDR5 繪圖記憶體,並支援全速 Double Precision 雙精度浮點數能力,讓「 Titan 」再次回復最強繪圖卡之名, HKEPC 找來由 Inno3D 送測的 GeForce GTX Titan Black 為讀者詳細介紹。
NVIDIA Kepler GPU 微架構
2008 年 NVIDIA 的 GPU 微架構發展路線圖
2008 年的 NVIDIA GPU Technology 大會上, NVIDIA 執行長 Jensen Huang 首次談及了公司未來 GPU 微架構的發展計劃, NVIDIA 將會以每兩年推出全新的 GPU 微架構的速度前進,按照當年的規劃, 2009 年將會推出具備 FP64 運算能力、代號為「 Fermi 」的 GPU 微架構、緊接於 2011 年推出具備 Dynamic Parallelism 運算能力是「 Kepler 」 GPU 微架構, 2013 年再推出加入 Unified Virtual Memory 設計「 Maxwell 」 GPU 微架構。
但計劃永遠與時程有所出入,「 Fermi 」 GPU 微架構原定於 2009 年 9 月正式發佈,卻受制於 TSMC 40nm 制程並不成熟需要作出修正,「 Fermi 」 GPU 最終要延至 2010 年 3 月才能上市,初上市已經是 A3 Stepping 更要顧及晶片良率的考量,高階繪圖晶片「 GF100 」需要屏敝部份 SM 運算單元才能符合量產 GeForce GTX 480 、 470 ,功耗較預期亦時脈提升空間有限, GeForce 400 系列並沒有取得預期的成功, NVIDIA 更需花上半年時間為晶片設計進行修正。
最終, 2010 年 11 月推出經改良的「 GF110 」繪圖核心的 GeForce GTX 580 ﹐「 Fermi 」 GPU 微架構實力才能完全發揮,接著 NVIDIA 開始為效能級「 GF104 」、中階「 GF106 」及入門級「 GF108 」繪圖核心作類似的改良,推出「 GF114 」、「 GF116 」及「 GF118 」、「 GF119 」繪圖核心, GeForce 400 系列開始過渡至 GeForce 500 系列,整個過程直至 2011 年 5 月才宣告完成,說好的「 Kepler 」 GPU 微架構亦要順延至 2012 年。
殺雞焉用牛刀 「 GK104 」足以應付對手 !!
NVIDIA 執行長 Jensen Huang 首次展示「 Kepler 」 GPU 微架構繪圖卡
汲取「 Fermi 」 GPU 微架構的失敗經驗, NVIDIA 在研發「 Kepler 」 GPU 微架構時不再以把高階繪圖核心優先,改為先完成複雜程度較低的效能級繪圖核心,吸收足夠的研發經驗並掌握制程技術後再推出高階型號,採用全新 TSMC 28nm 制程的「 GK104 」在首次試産已能正常運作,經少量修正後的 A2 Stepping 更無需屏敝任何 CUDA Core 就能滿足量産要求,功耗表現理想令晶片可運作於 1GHz 以上核心時脈,性能超出預期並壓倒當時對手最高階的「 Radeon HD 7970 」。
2012 年 3 月, NVIDIA 決定採用「 GK104 」繪圖核心推出「 GeForce GTX 680 」,雖然「 GK104 」性能表現足以力壓當時 AMD 最高階的 Radeon HD 7970 ,就算對手推出 GHz Edition 提升性能並降價還擊仍然無法取得優勢,「 Kepler 」微架構進程相當順利,由於「 GK104 」繪圖核心命名法則有別於 NVIDIA 一貫最高階型號,令外間均猜測「 GK110 」是否存在, 2012 年 4 月發佈的「 GeForce GTX 690 」會否才是「 Kelper 」 GPU 微架構的終極型態呢 ?
最終,「 GeForce GTX 690 」僅為兩顆「 GK104 」繪圖核心所組成的單卡雙晶片架構,而 AMD 於 2012 年亦表現非常沉靜無力還擊,在 2012 年餘下的三個季度, NVIDIA 開始為「 Kepler 」 GPU 微架構進行世代交接,中階的「 GK106 」、入門級的「 GK107 」繪圖核心,取代沿有「 Fermi 」 GPU 微架構產品線, 2012 年「 GK110 」一直只聞梯響最終沒有於現身繪圖卡市場。
「 GK110 」於 SC2012 大會初登場
「 GK110 」最早應用於 Tesla K20X 處理器産吕, NVIDIA 更與美國橡樹嶺國家實驗室合作組成超級電腦「 Titan 」
其實「 GK110 」早於 2012 年第二季試産成功,約在 2012 年第 30 週正式量產「 GK110 」 A1 Stepping 晶片, 2012 年 11 月 13 日舉行的 SuperComputer 2012 大會上, NVIDIA 正式宣佈發佈「 GK110 」繪圖核心的 Tesla K20 平行運算處理器系列,包括 Tesla K20 與 Tesla K20X 兩款型號,當中 Tesla K20 處理器已交付美國克萊姆森大學、印第安那大學、南加州大學、國家超級計算應用中心、國家海洋和大氣管理局等機構,會上更宣佈與美國橡樹嶺國家實驗室合作,研發基於 Tesla K20X 處理器的超級電腦「 Titan 」,這亦是「 GeForce GTX Titan 」名字的由來。
面對 Double Precision 雙精算應用不斷普及,加上「 GeForce GTX 690 」 繪圖卡採用雙晶片架構成本太高, NVIDIA 終於 2013 年 2 月 19 日正式發佈首款基於「 GK110 」的繪圖卡產品,型號為「 GeForce GTX Titan 」,其定位涵蓋旗艦 PC 遊戲應用與工作站運算應用,並取代「 GeForce GTX 690 」 沿有地位,嚴格來說「 GeForce GTX Titan 」並非 GeForce 700 系列其中一員。
直至 2013 年 5 月, NVIDIA 才正式發佈基於「 GK110 」的 「 GeForce GTX 780 」 繪圖核卡,沿有的「 GK104 」繪圖核心被重新規劃,納入 GeForce 700 系列之中,儘管「 GeForce GTX 780 」 同樣基於「 GK110 」繪圖核心,但 NVIDIA 刻意在功能與規格上與「 GeForce GTX Titan 」作出市場區間,包括 SMX 模組數目、記憶體支援容量以及是否支援 Double Precision 雙精度運算等等。
NVIDIA 於 2013 年 GTC 大會首次展示 GeForce GTX Titan 繪圖卡
「 GK110-B1 」令良率進一步提升
「 GK110 」的原生架構共擁有 15 組 SMX Units ,最高內建 2880 個 CUDA Core ,一般來說「 GK110 」晶片可能需要經過數次試產才能正常運作,如果出現設計上的瑕疵便需要作出修正,「 GK110 」同樣在首次試產便能正常運作,並決定量產 A1 Stepping 晶片應市。
由於對手仍未有相應產品可與「 GK110 」抗衡, A1 Stepping 晶片需然要屏敝運算晶元數目以滿足良率要求,但性能實在相較對時對手 Radeon HD 7970 以至雙晶片 Radeon HD 7990 更強大。
GeForce GTX Titan 採用了「 GK110-400-A1 」晶片, 14 組 SMX Units 提供 2688 個 CUDA Cores 、 224 個 Texture Units 與 48 個 ROP Unit 。 GeForce GTX 780 採用了「 GK110-300-A1 」晶片,進一步屏敝至僅 12 組 SMX Unit ,提供 2304 個 CUDA Cores 、 192 個 Texture Units 。
如同上代「 Fermi 」推出「 GF110 」繪圖核心一樣, NVIDIA 開始針對「 GK110 」 A1 Stepping 的積體電路瑕疵作出修正,「 GK110 」, B1 Stepping 晶片於 2013 年第一季已成功試產,並於第二季正式量產,其良率表現大幅提升並能滿足量產 15 組 SMX Units 完整架構的要求,首款採用 B1 版本晶片是工作站繪圖卡 Quadro K6000 於 2013 年 7 月正式上市。
2013 年 10 月 , 面對 AMD 正式發佈全新 Radeon R9 290 系列,在性能上顯著提升並終於趕上 GeForce GTX 780 , NVIDIA 決定調整產品線回應對手, 一方面以 GeForce GTX 780 降價迎戰 Radeon R9 290 ,緊接於 2013 年 11 月推出具備完整 15 組 SMX Units 的「 GK110-425-B1 」繪圖核心,命名為「 GeForce GTX 780 Ti 」 反撃 Radeon R9 290X 。
「 GeForce GTX 780 Ti 」的性能表現成功壓倒「 Radeon R9 290X 」的同時,卻令原定位最高階 3D 遊戲與運算應用的「 GeForce GTX Titan 」繪圖卡出現性能重疊之尷尬情況,不少測試均指出「 GeForce GTX 780 Ti 」性能超越「 GeForce GTX Titan 」 ,最終 NVIDIA 推出基於 B1 Stepping 的 GeForce GTX Titan Black ,讓「 Titan 」再次回復最強繪圖卡之名。。
2013 年 NVIDIA GTC 大會上, NVIDIA 執行長 Jensen Huang 修正了 GPU 微架構產品規劃,原定於 2013 年上市的「 Maxwell 」 GPU 微架構延至 2014 年上市,由於「 Kepler 」中高階產品仍具競爭力,首款基於「 Maxwell 」 GPU 微架構產品將是入門級的「 GM107 」,並命名為「 GeForce GTX 750 系列」。
「 Maxwell 」將會於 2014 年餘下的季度由中階續漸往高階進行世代交接,並由 28nm 轉入 20nm 制程,同時亦公佈了「 Volta 」 GPU 微架構計劃, NVIDIA 執行長 Jensen Huang 並沒有定下「 Volta 」 GPU 微架構推出的時間表,反正計劃永遠趕不上實際情況,對手能否迫得 NVIDIA 拿出真功夫,也是 NVIDIA 微架構世代交換速度的其中一大關鍵。
GTX Titan Black | GTX Titan | GTX 780 Ti | GTX 780 | |
Process | 28 nm | 28 nm | 28 nm | 28 nm |
Core | GK110-B1 | GK110-A1 | GK110-B1 | GK110-A1 |
Transistors | 7.1 billion | 7.1 billion | 7,1 billion | 7,1 billion |
GPU Architecture | Kepler | Kepler | Kepler | Kepler |
CUDA Cores | 2880 | 2688 | 2880 | 2304 |
Engine Clock | 889 MHz | 837 MHz | 875 MHz | 863 MHz |
GPU Boost Clock | 980 MHz | 876 MHz | 928 MHz | 900 MHz |
Single Precision (GFLOPS) | 5121GFLOPS | 4500GFLOPS | 5040GFLOPS | 3979GFLOPS |
Double Precision (GFLOPS) | 1300 GFLOPS (1/3)* | 1300 GFLOPS (1/3)* | 210 GFLOPS (1/24) | 166 GFLOPS (1/24) |
Memory Type | 384-bit | 384-bit | 384-bit | 384-bit |
Memory Size | 6 GB GDDR5 | 6 GB GDDR5 | 3 GB GDDR5 | 3 GB GDDR5 |
Memory Date Rate | 7 000 MHz | 6 088 MHz | 7 000 MHz | 6 008 MHz |
Memory Bandwidth | 336 GB/s | 288 GB/s | 336 GB/s | 288 GB/s |
Power Connectors | 6+8-pin | 6+8-pin | 6+8-pin | 6+8-pin |
Monitors Output | 2 st. DVI | 2 st. DVI | 2 st. DVI | 2 st. DVI |
1 st. HDMI | 1 st. HDMI | 1 st. HDMI | 1 st. HDMI | |
1 st. DP | 1 st. DP | 1 st. DP | 1 st. DP | |
TDP | 250 W | 250 W | 250 W | 250W |