八路144核心怪物!Intel頂級神U實測驚呆

Intel日前推出了Haswell家族的最後一名成員:
專門用於多路數據中心市場的Haswell-EX Xeon E7-x800 v3系列。

Xeon E7的每一代產品都會有更多核心、更強RAS性能、更高能耗比,以及更貴的價格
這一代也不例外。

那麼,它和Haswell-EP Xeon E5-x600 v3家族有何異同?
在這個頂級領域內有何表現?尤其是對比同樣定位的IBM Power8孰優孰劣?


首先看一下市場大環境。如今98%以上的新服務器系統都是Intel Inside,
92-94%的四路服務器都屬於Intel,這也約等於x86服務器的規模,RISC架構則越來越沉淪。

還記得嗎?IBM都已經將其x86服務器徹底賣給聯想,轉而一門心思發展Power系列,
還發起了OpenPower基金會,已有113個成員。


Xeon E7 v3的核心架構也是Haswell,事實上它和Xeon E5 v3幾乎沒有任何區別:


Haswell-EP Xeon E5 v3


Haswell-EX Xeon E7 v3



看出來了嗎?E7 v3就多了一條QPI總線,從而可以順利地組建四路、八路系統,
而二者的晶體管數量(56.9億個)、核心面積(662平方毫米)是完全一樣的,
也就是說,E5 v3只是屏蔽了一條QPI總線而已。——E5-2600系列是雙路的,E5-4600系列則是四路的。

不過,雖然核心是一樣的,但因為應用環境不同,
E7 v3的外部擴展功能更加豐富、複雜,尤其是內存子系統,
搭配新的控制芯片可以支持更多、更大的DDR3、DDR4內存,
四路系統如果有96條插槽可以支持最多6TB。這裡就不細說了。


Intel產品線的一大特色就是型號眾多而複雜,上一代E7 v2就針對不同用戶,劃分了多達21個型號:



E7 v3系列就精簡到了僅僅13款,
尤其是砍掉了雙路的E7-2800系列(在這方面E5-2600已經乾得很好了),
而且基礎型號從六核1.9GHz升級到八核2.0GHz,高端型號則其實都能拓展用於八路系統。

價格方面依然很殘暴,並且延續了頂級型號漲價的慣例,
8890 v2標價為6841美元,8890 v3就漲到了7174美元:
這多出來的333美元換來的是額外三個核心、10W熱設計功耗和更快的QPI總線。


以下是官方宣稱的基準性能提升,事實如何後邊來檢驗。


【最大的敵手:IBM Power8】

藍色巨人的傑作是一個高IPC、高頻率的精品,
每個核心每時鐘週期可以解碼、分發、執行、收回8條指令,所以八線程是很必要的,
因此核心數量雖然只有12個,Intel的三分之二,但線程數高達96個,Intel的2.7倍。

官方宣稱第二條線程能提高大約45%的性能,第三和第四條能再提升30%,最後四條則可繼續提升7%。



IBM Power8的整體規格要比Intel Xeon E7 v3強得多,
但也有不足的地方,包括二級緩存非全速運行、eDRAM三級緩存更大但更慢、超標量架構和高頻率導致功耗過高等。
12核心的頻率只能達到3.1GHz,此時熱設計功耗已達190W;
4GHz則只有8核心能做到,熱設計功耗此時是瘋狂的247W。
相比之下,E7 v3系列最高也不過165W(18核心2.5GHz、10核心2.8GHz)。

另外,IBM的內存控制芯片功耗也更高,達到了16-20W,
Intel這邊則只有9W,所以一顆處理器加內存控制芯片,
Intel 201W(165+9×4),IBM 270W(190+20×4)。


本次參加測試的Intel處理器主要有:
- Xeon E7-8890 v3 18核心2.5GHz/45MB/165W
- Xeon E7-4890 v2 15核心/2.8GHz/37.5MB/155W
- Xeon E7-4870 10核心/2.4GHz/30MB/130W
- Xeon X7650 8核心/2.3GHz/24MB/130W
- Xeon E5-2699 v3 18核心/2.3GHz/45MB/145W


【實測成績一覽】


旗開得勝,四路E7 v3(72核心144線程)完爆雙路Power8(24核心192線程),
甚至上代的E7 v2都能戰勝後者,但是雙路E5 v3(36核心72線程)不低。


如果是八路系統,IBM取得完勝,但別忘了價格上IBM也是完勝,一套頂Intel好幾套。


內存帶寬表現不錯,得益於更快的SMI總線比上代有了很大進步,不容易。


單核心壓縮性能:如果只開一個線程,E7 v3比上代提升了大約10%,也完勝Power8,
但如果都打開超線程,Power8四倍的線程數量就發威了。


單核心解壓性能:E7 v3因為頻率吃了點虧,Power8則依然可以憑藉更多線程遙遙領先。


多線程壓縮解壓:18核心36線程輕鬆滅掉更高頻率的15核心30線程,而且壓縮對更多核心的支持更好。


Linux內核編譯性能也比上代提升了40%,更是五年前的足足三倍。


高性能計算性能倒是一般,看來得對AVX2指令集深度優化才行。


空閒功耗比上代有所增加,可能是DDR4緩衝芯片的緣故?(工藝都是22nm)


滿載功耗還降低了呢。


總能耗方面,E7 v3也有所降低,雖然差別很小,但可別忘了總體性能是有了巨大提升的,所以能耗比明顯更強了。

LZMA compress 一粒 i7 4 核至得 2 萬分左右

22 萬分真是另一個次元

TOP

144核, intel黑科技

TOP

回覆 2# usei


要睇程式會否支援多核心才可以.

如果不是, 其實與普通沒有多大分別.

TOP

回覆  usei


要睇程式會否支援多核心才可以.

如果不是, 其實與普通沒有多大分別. ...
polarhei 發表於 2015-5-12 15:36


轉片 / 壓縮 容易寫多線支援
而且 scale 得好好

TOP

明顯唔係家用... 唔需要擔心咩程式支唔支援啦
是但裝個Apache Web Server都食到無限Cores

TOP

回覆 5# usei

其實, 要達到目的, 仍然需要超算先得, 始終八路系統太過昂貴.

TOP

本帖最後由 Kundera 於 2015-5-12 20:38 編輯

Intel managed to close gap with IBM but Power8 is very competitive here. Offering the same performance using fewer cores means huge saving from software licence. The total cost to run a Power8 could be less than the E7 though IBM charges you more for the hardware.

One more thing didn't quite mentioned in Anand's article is the impact of memory bandwidth. The test system has 'only' 256GB memory installed. It wasn't quite represent the real world scenario as they are designed to address some TB of memory to cache the entire database. E7 has only half the bandwidth, less L1-L3 cache, and no L4 cache means it is miles behind the RISC big iron.

TOP

Intel managed to close gap with IBM but Power8 is very competitive here. Offering the same performan ...
Kundera 發表於 2015-5-12 20:36



    "only"
Really want to see how these monster build.
Not to mention those mainframe

TOP

Intel managed to close gap with IBM but Power8 is very competitive here. Offering the same performan ...
Kundera 發表於 2015-5-12 20:36



    people are welcome to hear that
IBM+NVIDIA, Google, Rackspace, OpenPOWER are challenging Intel's dominance in server space

intel 係要落後先會被逼出aggressiveness

TOP