
AMD 再向 Intel 投下震撼彈 !! 採用 7nm 制桯、Zen 2 微架構、第 3 代 Ryzen Threadripper 處理器正式登場,相較上代 Zen+ 架構性能平均提升 15%、Cache 容量倍增,升級 PCIe 4.0 傳輸技術,優化 DDR4 記憶體控制器,HKEPC 編輯部找來全新 AMD Ryzen Threadripper 3970X 處理器, 與 Intel 最高階的 Core i9-10980XE 及上代 2990WX 作效能對比測試。
代號「Castle Peak」、第三代 Ryzen Threadripper 登場
相隔 4 個月,AMD 再次向 Intel 投下 7nm 震撼彈,代號「Castle Peak」、第 3 代 Ryzen Threadripper 處理器正式登場,採用全新 Zen 2 微架構令 IPC 性能較上代提升 15%,更先進的 7nm 制程令最高時脈提升約 350MHz,性能已完全拋離 Intel Core i9-10980XE 被迫半價求售,在 1000美元以上的 HEDT 桌面平台 Intel 已無任何產品對應,高階已被 Ryzen Threadripper 完全佔據。
▲ AMD 完全稱霸 US$1000 以上的 HEDT 市場
第三代 Ryzen Threadripper 初發佈共有兩款型號,包括 24 核心、48 線程的 3960X、32 核心、64 線程的 3970X,售價分別為 US$1,399、US$1,999,緊接將會在明年 Q1 推出 64核心、128 線程的 Threadripper 3990X,售價未定,對於媒體制作、工業運算等專用應用帶來了明顯性能提升,雖然 Intel Core-X 降低售價後令 Ryzen Threadripper 性價比有所減弱,但對於專業用家來說時間就是金錢,市場仍對第三代 Ryzen Threadripper 有著極高評價。
採用 Chiplet 多晶片設計
▲ Castle Peak 採用了 Chiplet 多晶片技術
第三代 Ryzen Threadripper 處理器採用全新的 Chiplet 多晶片設計,相較過去採用單純的 Multi Core Module 架構,「Castle Peak」將 CPU 核心與其他 I/O 單元分拆成 Chiplet 晶片, CCD 晶片採用 7nm 制程、內建 2 個 CCX 模組、8 個 CPU 核心, cIOD 晶片採用 12mm 制程內建 IMC 記憶體控制器及其他高速 I/O 介面功能,這樣的設計令 AMD 可以相同的封裝空間中提供更多 CPU 核心。
▲ Ryzen Threadripper 3970X 採用 4 CCD + 1 cIOD 配置
舊有 12nm Zeppelin 晶片大小為 213mm²,其中 CCD 佔約 120mm² ,其他 I/O 與 IMC 記憶體控制器等佔約 93mm²,要達成 32 核心就要 4 顆完整的 Zeppelin 晶片佔 852mm²,多出來的 I/O 與 IMC 記憶體控制器將被屏蔽。全新的Chiplet 設計 7nm CCD 晶片只有 74mm²,cIOD 晶片為 416mm²,要達成 32 核心只需 4 顆 CCD + 1 顆 cIOD 晶片, 晶片合共為 712mm²,如果是 64 核心的話差距將會更大,全新 Chiplet 多晶片設計令 Ryzen Threadripper 在多核心組成上更具彈性。
全新 AMD Zen 2 微架構
上代 Ryzen Threadripper 採用的「Zen+」微架構屬於半代更新,僅針對 Cache 及記憶體系統作出改動,第 3 代 Ryzen Threadripper 改用「Zen 2」微架構的帶來了明顯的性能改良,包括了增加內部頻寬、提升運算單元使用率、提升緩存命中率、提升單一週期指令執行數等等,主要改進及全新設計包括︰
→ 改用 256bit Single-Op 浮點單元
→ μOps Cache 容量倍增至 4096 byte
→ 全新的 TAGE 預測分支設計
→ 增至 3 組 AGU 單元
→ 增加 Load/Store Bandwidth
→ L3 Cache 容量提升 1 倍
→ 改良 Fetch 及 Pre-Fetch 能力
→ 改良 ALU 及 AGU Schedulers
→ 增加 Register File 容量
→ IMC 控制器改良、提升至 DDR4-3200+
▲ AMD Zen 2 微架構 Block Diagram
代號 Castle Peak、AMD 第 3 代 Ryzen Threadripper 處理器基於經改良的 Zen 2 微架構,相較上代 Zen+ 微架構性能平均提升 15%、Cache 容量倍增,率先支援 PCIe 4.0 傳輸技術,優化 DDR4 記憶體控制器,加上 7nm 制程改進令時脈進一步提高,令處理器運算性能較上代明顯提升,有關於 Zen 2 微架構的詳細講解,可以參考︰
https://www.hkepc.com/18105/AMD_Zen_2_Microarchitecture
TSMC 7nm、時脈提升 350MHz
▲ TSMC 7nm 制程的 CCD Die Shot
AMD 第 3 代 Ryzen 處理器除了針對微架構作出改良外,更採用了先進的 TSMC 7nm 制程技術,CCX 模組尺寸由 44mm² 縮減至 31mm²、相較上代 12nm 制程電晶體性能提升約 15~20%,令處理器的核心時脈可進一步提升,同時降低了處理器 V/f 曲線所需要的電流,在相同電壓下核心時脈提升 350MHz。
Ryzen CCX 線程管理
Windows 10 May 2019 (1903) 更新特別針對 AMD Ryzen 的 CCX 模組作出優化,OS 能分辨出不同的 CCX 模組,當執行中的程序產生新的線程時,OS 會優先分配到相同的 CCX 模組內的 CPU 核心,如果 CCX 模組被填滿,就會選擇同一個 CCD 晶片內鄰近的 CCX 模組,盡量避免同一個程序的線程在兩個不同 CCD 晶片的 CPU 核心運作,避免不必要的運算延遲。
此外,當兩個不相關連的程序執行時,OS 會優先選擇將線程給與不同的 Chiplet 執行,這樣 CPU 可以通過相隔較遠區域令晶片熱力平均化,從而提供最高的 Precision Boost 時脈。
據 AMD 指出,Ryzen CCX 線程優化功能將適合於所有 Ryzen、Ryzen Threadripper 處理器系列上,其性能提供最高可達 15%,官方建議所有 AMD Ryzen 用家升級至最新 Windows 10 May 2019 (1903) 版本。
Ryzen Clock Selection 功能
Windows 10 May 2019 (1903) 另一項優化是針對 Zen 2 微架構加入 Ryzen Clock Selection 技術,這功能原理與 Intel 的 Speed Shift 技術相同,能使作業系統快速調整 CPU 的 P-State,讓 CPU 可以更快從節能模式回到最高時脈,Skylake 微架構的 P-State 延遲約為 40ms、Kaby Lake 微架構下降至約為 15ms,而 AMD Zen 微架構約為 30ms。
全新 Zen 2 微架構加入了 UEFI CPPC2 (Collaborative Power Performance Control 2) 支援,能夠為處理器時脈帶來更快的反應性,時脈反應延遲大幅降至只有 1-2ms,將有效提升突發工作負載及應用程式的執行反應。
據 AMD 指出,Ryzen Clock Selection 可以令應用程式啟動速度提升達 6 %,如果買了第 3 代 Ryzen 處理器的家,記得安裝至最新 Windows 10 May 2019 (1903) 版本。