2024-04-05
NVIDIA 「澄清」美國出口管制
GeForce RTX 4090 D 將不受此限
文: 編輯部 / 新聞中心
文章索引: IT快訊

【全世界擺大烏龍 😂】路透社 3 日報導,美國商務部上月 29 日再次更新高科技出口管制要求,在 ECCN 4A0030.C 條文中追加了全新限制,超過 70 TFLOPS 都不能出口中國。但 NVIDIA 4 日主動通知國外媒體,重新澄清指 ECCN4A0030.C 條文的一些字眼被混淆和誤解,並確認 GeForce RTX 4090 D 與 H20 GPU 將不受新限制所影響。

 

據 Tom's Hardware 5 日報導,ECCN4A0030.C 條文中有閞於「調整後峰值性能」(APP) 和「加權萬億次浮點運算」(WT),限制為 70 TFLOPS 或更低,只適用於「具有記憶體一致性 (Memory Consistency) 的系統」,而不是單一 GPU,例如 4 路 DGX H100 系統就屬於此分類。

 

NVIDIA 主動通知媒體時指出,要符合 ECCN4A0030.C 新修定的要求,該晶片是需要能透過快取或記憶體定址,以硬體方式來存取系統中的任何記憶體位置,而不需要任何軟體機制的參與,因此 GPU 並不受這項條文所規範。

 

此外,條文中另一個重要細節是「調整後峰值性能」只適用於經「加權」的 FP64 吞吐量,因為該值根據它是向量處理器還是標量(非向量)處理器進行縮放。換句話說,透過 Nvidia Tensor 核心等向量單元完成的 FP64 與透過運行 64 位元計算的 CPU 完成的 FP64 不同。

 

而要確定「加權 teraflops」和「調整後的峰值性能」兩項數值,是需要計算系統的 FP64 總吞吐量。然後,對於向量處理器乘以 0.9,或對於非向量處理器則乘以 0.3。回到以 4 路 DGX H100 的系統為例,GPU 的 H100 SXM 的向量 FP64 吞吐量為 67 teraflops,四路合共可提供 268 teraflops 總吞吐量,再乘以 0.9 則得到 241.2 teraflops,因而遠高於 70 加權 teraflops 限制。

 

GeForce RTX 4090 D 幾乎無法提供任何 FP64 吞吐量,只有 1.15 TFLOPS,儘管它仍然接近 4,800 TPP 限制,但 NVIDIA GeForce RTX 4090 D 因此並沒有被禁止出口。

 

 

 

資料來源:

 

發表評論