回復 1 #cbsphoto

glm 4.7/5真係好勁
有傳partly/all 用上华为chip

via HKEPC Reader for Android

TOP

本帖最後由 javacomhk 於 2026-3-27 01:08 編輯

報導中最需要留意的「語言藝術」
1. 基準對象的選擇:為什麼是 Nvidia H20?
H20 是什麼: Nvidia H20 是當年為了規避美國出口管制,專門為中國市場「閹割」過的版本(其算力僅約為旗艦 H100 的 15%-20%)。

2. FP4 精度的「數字遊戲」
• 精度與速度的權衡: FP4(4位浮點數)是極低精度的格式。雖然計算速度極快,但在大模型推理中,過低的精度可能導致模型「變笨」或邏輯出錯。
• 用途受限: FP4 主要用於推理(Inference)而非訓練(Training)。大多數嚴謹的科學計算或基礎模型訓練仍需 FP16 或更高精度。因此,1.56 PFLOPS 是一個專門針對「特定場景」的高分,不能代表全方位的戰鬥力。

3. 效能代價:功耗
• 600W vs H20: Atlas 350 的功耗是 H20 的 1.5 倍。這意味著在同樣的數據中心機架空間內,Atlas 350 對散電和供電的要求更高。算力的提升部分是靠「堆功率」換來的,這在能源效率(Performance per Watt)上並不一定有絕對優勢。

TOP

本帖最後由 VV 於 2026-3-27 11:12 編輯

國內 行Cluster算力 , 高效信息網絡 ,唔依賴 CUDA (封閉技術) 和 電力平供應足 係一個優勢....

樣樣制裁下有咁既成績已經超額完成, 希望進一步拉近距離

btw, H200 都唔主張要後邊一定有原因(2025)

TOP

本帖最後由 latali 於 2026-3-27 06:14 編輯
其他唔驚, 最驚AI hack到入中美俄是但一方核彈裝置然後按發射...
jimking332 發表於 2026-3-25 06:48


呢個真有可能,因為AI有搜尋網絡能力,網上好多幻想文,有用既無用既資料集合埋理性分析可能性,推出有能力實現既方法出黎,然後又有實行能力同權限,比如寫程式然後自行UPLOAD上網,咁樣寫一D代碼病毒出黎感染全世界電腦同手機都得。

TOP

從冇到有, 從有到精.....
從來不是易事.....當然要keep住努力...

另一定要擺脫別國單一依賴, 依家走出CUDA ...
VV 發表於 2026-3-27 07:06

華維有自家光核機的  

TOP

華維有自家光核機的
六代火龍 發表於 2026-3-28 14:20



    但未到精.... btw, 仲有相關晶片設備和技術都要好好進步..........

TOP

但未到精.... btw, 仲有相關晶片設備和技術都要好好進步..........
VV 發表於 2026-3-29 08:45

已經用上EUV了 再上要精上加精都係華維領先 因為佢比台乜電更有優勢 就係佢連生產成品 至到銷售入屋 都做埋 真正全方位一條龍服務 呢個係其他芯片廠做不到的  

TOP

其實佢地可唔可以用 d 易明 d 的比較,例如要 generate 一條 ai 片,即係大陸好流行 d 霸總片,Nvidia 要幾耐,投資與運作成本幾多,用大陸 chips 要幾多。

TOP

贏了
今次贏麻了

TOP

已經用上EUV了 再上要精上加精都係華維領先 因為佢比台乜電更有優勢 就係佢連生產成品 至到銷售入屋 都做 ...
六代火龍 發表於 2026-3-29 20:15



    要 量產同良率 仲有大距離.....

TOP