
雖然 Intel Ivy Bridge 處理器以出色的性能牢牢控制了中高價市場,而 AMD 則已把業務發展重點放在整合 GPU 的 APU 處理器上,不過為針對需要高效能的 AMD 用戶,在 Piledriver 架構的 Trinity APU 推出後, 隨即推出不含 GPU 的 Piledriver 架構 FX 處理器,以「 Higher Frequency, Unlocked, More Cores at every price points 」作為賣點,為 AMD 用家帶來升級機會。
製程不變性下的奇跡 Piledriver 性能提升 15%
Piledriver 作為第二代產品, AMD 計劃是把它作為成熟版 Bulldozer 核心,適用於 Desktop 、 Mobile 、 Workstation/Server 市場,所以改良的重點在功耗及提升 IPC(Instruction Per Clock) 上,計劃提升 10-15% 的效能。
上一代 Bulldozer 提供 Desktop 中最多的 8 核心設計,令 Bulldozer 晶片較 (315mm2) 同期的 Sandy Bridge (216 mm2) 大 ,僅比 Sandy Bridge-E (435mm2) 小。在 Piledriver 未改用 22nm 工藝前,增加核心數目只會大大增加功耗,令每個核心工作時脈需要降低,未必是最有效的方法,所以 Piledriver 架構把節省的 TDP 用作提升時脈,從 FX-8150 時的 3.6GHz 提升至今代 FX-8350 的 4.0GHz Base Frequency ,而在 Turbo Mode 方面, FX-8350 不需要水冷即可以 4.2GHz 工作,而 FX-8150 則需要有賴水冷等特別散熱才可在 4.2GHz 工作,一般為 3.9GHz ,表現大幅提升。
無獨有偶的是, Intel Core i7 3960X Extreme 沒有用盡 Sandy Bridge-E 核心可以提供的 8 核心以至 10 核心的設計,維持 6 核心 12 線程但改為提升時脈的做法,當中便考慮到功耗散加的問題,加上現時軟件未能發揮 8 核心的優勢,不比提升時脈以增加效能理想。
早在 Bulldozer 推出時, AMD 已計劃規劃了隨後的三代產品 --Piledriver, Steamroller 及 Excavator
繼續改良分支預測與 Cache 架構、新增指令集功能
Piledriver 在分支預測與 Cache 架構作出多項改進
Bulldozer 繼續在分支預測及 Cache 架構的改進,達到提升 CPU IPC 性能的效果, Piledriver 改進 Branch Prediction 功能及 Cache 架構,對 L1 BTB 、 L2 BTB 及 Prediction Queue 作出優化。而在 x86 Decoders 方面, Piledriver 維持在 4-way 解碼,但新增了 FMA3 及 F16C 兩條指令。
FMA3 是 Intel 版的 FMA (Fused Multiply / Add extensions) 指令,功能與 AMD FMA4 相似,預計將在 Intel 下一代 Haswell 架構中提供。而 F16C (Half Precision Float Conversions) 在 Ivy Bridge 晶片已經加入, Piledriver 加入此指令實現了 AMD 、 Intel 指令集上的統一。
隨下是改進了的 Int. Scheduler 及 60 Entry FP Scheduler ,下有加大 Load Queue 容量的 Load/Store Unit ,可改進 Store 到 Load Forwarding 及 lock performance 等。另外是容量倍增的 L1 TLB , TLB (Translation Look-a-side Buffer) 的作用是儲存記憶體頁面的地址,更高的容量有助儲存更多數據的記憶體頁面地址,加快 CPU 尋址的效率, Piledriver 還加強指令執行單元的速度,如優化 INT/FP divide , SYSCALL 及 SYSRET 指令的處理能力,在 L2 Cache 方面,加強了 Hardware Prefetcher ,優化 Page translation reload ,以及改進 L2 Cache 工作效率等等。
對於 Piledriver 的 CPU-NB 功能,基本上沿用了 Bulldozer 的設計,如 CPU-NB 仍然為 2.2GHz ( 高階型號 ) 及 2GHz ( 一般型號 ) ,原生支援最高 Dual Channel DDR3-1866 記憶體,而 I/O 是用 HyperTransport ,速度為 4GT/s ,並未有突出改變。
Piledriver 的 L1 Cache 、 L2 Cache 容量沒有改變
Piledriver 的 CPU-NB Frequency 仍然為 2.2GHz
AMD 承認 Piledriver 要在多線程時才能發揮最大效能
Istanbul | Bulldozer | Piledriver | Sandy Bridge | Sandy Bridge-E | Ivy Bridge | |
Architecture | K10.5 Stars | Zambezi | Vishera | Sandy Bridge | Sandy Bridge-E | Ivy Bridge |
Flagship Model | 11000T | FX-8150 | FX-8350 | i7-2700K | i7-3960X | i7-3770K |
Process Technology | 45nm SOI, Immersion Lithography | 32nm HKMG, SOI, Immersion Lithography | 32nm HKMG, SOI, Immersion Lithography | 32nm HKMG | 32nm HKMG | 22nm Tri-Gate |
Transistors | 0.904 Billion | 1.2 Billion | 1.2 Billion | 1.16 Billion | 2.27 Billion | 1.4 Billion |
Die Size | 346mm2 | 315mm2 | 315mm2 | 216mm2 | 435mm2 | 160mm2 |
Package | AM3 | AM3+ | AM3+ | LGA1155 | LGA2011 | LGA1155 |
CPU Core/Thread | 6C6T | 8C8T | 8C8T | 4C8T | 6C12T | 4C8T |
CPU Clock (Max.) | 3.3GHz | 3.6GHz | 4.0GHz | 3.5GHz | 3.3GHz | 3.5GHz |
L1 Cache | 64KB I + 64KB D | 16KB I + 64KB D(Share by 2 Core) | 16KB I + 64KB D(Share by 2 Core) | 32KB I + 32KB D | 32KB I + 32KB D | 32KB I + 32KB D |
L2 Cache | 512KB Per Core | 1MB Per Core | 1MB Per Core | 256KB Per Core | 256KB Per Core | 256KB Per Core |
L3 Cache (Max.) | 6MB | 8MB | 8MB | 8MB | 15MB | 8MB |
x86 Decoder | 3 | 4(Share by 2 Core) | 4(Share by 2 Core) | 4 | 4 | 4 |
Advanced ISA | SSE4a | SSSE3, SSE4.1/2, AES, AVX, FMA4, XOP | SSSE3, SSE4.1/2, AES, AVX, FMA3/4, XOP, F16C | SSSE3, SSE4.1/2, AES, AVX | SSSE3, SSE4.1/2, AES, AVX | SSSE3, SSE4.1/2, AES, AVX, F16C |
Unlocked Version Available | Yes | Yes | Yes | Yes | Yes | Yes |
Turbo Clock (Max.) | 3.7GHz | 3.9GHz (4.2GHz @special case) | 4.2GHz | 3.9GHz | 3.9GHz | 3.9GHz |
IMC Support | DDR3-1333 2CH | DDR3-1866 2CH | DDR3-1866 2CH | DDR3-1333 2CH | DDR3-1600 4CH | DDR3-1600 2CH |
TDP (Max.) | 125W | 125W | 125W | 95W | 130W | 77W |
I/O | 4GT/s HT | 4GT/s HT | 4GT/s HT | 5GT/s DMI | 5GT/s DMI | 5GT/s DMI |
Offical Price | US$194 | US$183 | US$195 | US$332 (Tray), US$342 (Box) | US$999 (Tray), US$1059 (Box) | US$332 (Tray), US$342 (Box) |