Intel發佈第三代可擴展至強:八路224核心、唯一數據中心AI CPU

今天,Intel正式發佈了第三代至強可擴展處理器,代號「Cooper Lake」,頻率、核心數、內存等提升的同時,重點強化了DLBoost深度學習能力,是當今全球唯一內置AI的主流數據中心處理器。
Cooper Lake主要面向四路、八路市場,今年晚些時候還將有基於10nm Ice Lake的至強,針對單路、雙路市場,二者互補構成完整的第三代家族。
至於為何如此劃分,Intel給出的解釋是更多客戶希望在更多路系統上進行AI強化。


Cooper Lake仍然採用14nm工藝製造,最多28核心56線程(八路就是最多224核心448線程),部分型號增加了核心數量,同時頻率更高,基準頻率提升至最高3.1GHz,單核睿頻加速最高則可達4.3GHz,三級緩存最多38.5MB(每核心對應1.375MB),熱設計功耗150-250W
內存支持六通道DDR4,最高頻率3200MHz,單路最多12條,並支持16Gb高密度顆粒,單路最大容量可達4.5TB,八路就是36TB,當然也支持Intel自家的Optane PMem傲騰可持續內存,而且配合發佈了新的200系列。
技術方面,部分型號新增加了Intel Speed Select(SST)技術,包括STT Core Power(SST-CP)、SST Turbo Frequency(SST-TF),可優化處理資源,提升工作負載性能、提高資源利用率、優化平台TCO成本,同時支持Intel AVX-512指令集、VNNI/BFloat16深度學習加速指令集。
由於面向四路、八路系統,Cooper Lake都內置了六條UPI互連總線,最高傳輸率達10.4GT/s。
輸入輸出方面,處理器支持最多48條PCIe 3.0通道,搭配C620A系列芯片組(包括C621A、C627A、C629A)還可提供最多20條PCIe 3.0、10個USB 3.0、14個SATA 6Gbps,處理器與芯片組互連通道為DMI 3.0 x4。
Cooper Lake封裝接口自改成了新的Socket P+,又稱為LGA4189,未來的Ice Lake也是這一新接口,都不兼容現在的LGA3647平台。


八路系統結構圖


LGA4189插座


AI無疑是這三代可擴展至強的最大特色,而且一直在飛速前進。
2017年的第一點支持AVX-512 FP32浮點格式,具備高精度優勢,得到了24項優化,金山雲、美的、南京大學、盈谷等中國科技企業、機構等都做了部署。


2018年的第二代加入了DLBoost INT8整數格式,44項優化,我們也看到了更多國產機構的名字:上海交大、京東雲、雲創大數據、智芯原動、匯醫慧影、青雲QingCloud、東軟等等。


而在最新的第三代上,我們又迎來了新的BFloat16(簡稱BF16),專為AI運算、深度學習等應用而開發,一方面適當降低了精度(依然很接近FP32),從而提高能效,軟件應用也不需要太多調整,另一方面則大幅提升了AI性能,官方宣稱相比上代FP32訓練性能提升最多1.93倍、推理性能提升最多1.9倍。
目前,支持BF16的第三代至強可擴展處理器已經獲得了阿里雲、螞蟻金服、騰訊雲、海鑫科金、東軟等公司的支持,實測顯示各項性能提升少則54%,多則97%。
BF16標準還已經獲得Google、微軟、ARM及其他AI公司的廣泛採納,Intel至強則是x86陣營中第一家、也是唯一一家支持它的CPU處理器。


根據Intel官方數據,如果以至強E7 v4系列為基準,AI訓練性能方面,三代可擴展至強使用AVX-512的話提升幅度為82%,BF16加持的DLBoost則能帶來2.14倍的提升;AI推理性能方面,AVX-512只能獲得1.04倍的提升,INT8可達到5.25倍,BF16則是2.66倍。


強大的生態支持從來都是Intel的無敵優勢,這次也不例外,在官方支持名單中可以看到一連串大名,其中既有諸多全球的科技企業、科研機構、軟件巨頭、高校,也不乏眾多中國互聯網和科技企業、高等院校、通信運營商,甚至可以看到銀聯、韻達快遞。


Cooper Lake三代可擴展至強分為三個子系列,總計11款不同型號,編號都以H或者HL結尾,區別在於HL支持單路最多4.5TB內存,H的則是1.12TB。
最高端的至強鉑金8300系列有六款型號,分別是8380HL、8380H、8376HL、8376H、8354H、8353H,前四款28核心56線程,後兩款18核心36線程,熱設計功耗150250W,內存頻率最高3200MHz(每通道一條)或者2933MHz(每通道兩條),支持四路、八路擴展。
至強金牌6300系列有三款型號,分別是6348H、6328HL、6328H,前一款24核心48線程,後兩款16核心32線程,熱設計功耗都是165W,內存頻率最高2933MHz,僅支持四路。
至強金牌5300系列有兩款型號,分別是5320H、5318H,一個20核心40線程, 一個18核心36線程,熱設計功耗150W,內存頻率降至2666MHz,僅限四路,該系列RAS能力有所精簡。
其中,金牌6328HL、6328H、5320H、5318H四款支持SST技術。


Intel稱,對比五年前的老平台(應該是至強E7 v3?),三代可擴展至強的平均性能提升達90%,平均數據庫性能提升則可達98%。


如果客戶不知道該選擇哪款型號,Intel還根據實際應用做了針對性的推薦,比如主做AI訓練的,就選更多核心的8380H、8376H、8354H;如果是內存密集型應用,自然優先選更多核心還支持大內存的8380HL、8376H;如果主要用於虛擬機,則推薦6348H這種核心數、內存都最適中的;

      

http://news.mydrivers.com/1/696/696154.htm