
主流級 GeForce RTX 5060 終於上市,MSRP 定價 US$299,採用全新 GB206-250 繪圖核心,擁有 3,840 個 CUDA Cores、30 個 RT Cores、120 個 Tensor Cores / Texture Units 及 48 個 ROPs,運算單元數目較上代提升了 25%,不過仍主要靠著 DLSS 4 多幀生成技術帶來 FPS 幀率大幅提升。HKEPC 編輯部找來了 GeForce RTX 5060,與上代 RTX 4060 作多方面效能對比測試。
主流級 GeForce RTX 5060 登場
NVIDIA 早前在 5 月 19 日發布了基於 Blackwell GPU 架構、核心代號 GB206-250 的主流級 GeForce RTX 5060,然而 HKEPC 編輯部做不到 RTX 5060 的首發評測,原因無他——因為 NVIDIA 除了沒有提供官方樣本外,亦沒有預早提供媒體版驅動程式。即使 HKEPC 編輯部在 19 日前已收到其他 AIC 廠商送測的 RTX 5060,在沒有驅動程式的情況下,仍不能提早測試顯示卡;等到 19 日驅動程式上架當日,整個編輯部亦已身處台北準備參加 Computex 2025,筆者要等到 Computex 完結後回港才可以開始測試工作,感謝各位讀者耐心等待。
RTX 5060 相較上代 RTX 4060,多了 25% 的 CUDA Core,同時由於摩爾定律逐漸失效,傳統 GPU 設計已無法以原生渲染方式維持理想的遊戲幀率,NVIDIA 改向 Neural Rendering 神經渲染技術發展,將 AI 技術導入遊戲應用中,Microsoft 亦宣布未來的 DirectX 將正式支援向量運算協作,全面解放 Tensor Cores 用於遊戲運算,GPU 硬體與 PC 遊戲界正迎來重大變革。
NVIDIA 新一代 Blackwell GPU 非常著重於 Neural Rendering 神經渲染的性能提升,透過原生傳統渲染的一小部分成本生成絕大多數圖元。配合 DLSS 4 超解析度和 MFG 多幀生成技術,大幅提高遊戲幀率;再透過 DLSS 光線重建 (RR),利用先進的 AI 方法對缺失的細節進行降噪和重建,以更低的運算成本和記憶體佔用達成原生渲染級畫質。
此外,全新 Neural Rendering 神經渲染與 Neural Shaders 神經著色技術,將加速遊戲開發人員對 AI 的應用。例如,即時生成和創建各種地形、物理模擬、更複雜的 NPC 角色行為,甚至即時生成遊戲背景故事等。Blackwell GPU 正在改變整個 PC 遊戲的生態發展。
與 RTX 4060 相比,NVIDIA GeForce RTX 5060 在 Shader Cores 性能提升大約是 5~6%,不過在 Tensor Core 全新 FP4 技術支援下,遊戲性能卻實現接近倍數增長,沒錯 !! 就是靠 DLSS 4 充撐場面。以下是 Blackwell GPU 的主要關鍵創新:
◾為神經渲染而生的全新 SM 單元︰大幅增強神經渲染運算能力。與 NVIDIA Ada GPU 相比,NVIDIA RTX Blackwell SM 在每個時鐘週期的整數數學輸送量提高了一倍,這對於提高神經著色中至關重要的位址生成工作負載性能極為有利。
◾全新第 4 代 RT Core︰Blackwell GPU 對 RT Core 架構進行了重大革新,帶來全新的光線追蹤體驗和神經渲染技術,進一步提升圖形性能。
◾全新第 5 代Tensor Core︰引入全新的 FP4 功能,能將 AI 輸送量提升一倍,同時將記憶體需求減半。此外,Blackwell 的數據中心級 GPU 還搭載第二代 FP8 Transformer 引擎,進一步提升處理效能。
◾NVIDIA DLSS 4︰全新 NVIDIA RTX Blackwell 架構支援 AI 多幀生成功能,能將 DLSS 4 的幀速率提升至上一代 DLSS 3/3.5 的兩倍,同時保持甚至超越原生畫質,並確保低系統延遲。
◾RTX 神經著色器︰引入小型神經網路至可程式設計著色器,開啟 GPU 圖形運算的新時代,為遊戲開發者提供更靈活的創作工具。
◾AI 管理處理器(AMP) - AMP 支援多個 AI 模型(包括語音、翻譯、視覺、動畫、行為等)與圖形工作負載同時共用 GPU,提升多任務處理能力。
◾GDDR7 Memory - GDDR7 ︰採用全新的超低電壓 GDDR 顯存標準,並使用 PAM3(脈衝幅度調製)信號技術,實現更高速的顯存子系統,同時進一步提升能效。
◾Mega Geometry 技術︰一種新的 RTX 技術,旨在大幅提升光線追蹤應用中的幾何細節,帶來更逼真的視覺效果。
GeForce RTX 5060 定價 US$299
NVIDIA 於四月中同步公布了 GeForce RTX 5060 Ti 及 RTX 5060 的售價,RTX 5060 的定價為 US$299,維持上代 RTX 4060 的水平,然而因應全球關稅不穩定的局勢,MSRP 售價的實際參考意義可能有限。
TSMC 4N 制程 NVIDIA GB206 繪圖核心
NVIDIA GB206 繪圖同樣基於全新 Blackwell GPU 微架構,並應用於 GeForce RTX 5060 Ti、GeForce RTX 5060 及 GeForce RTX 5070 Laptop 產品之中。由於今代仍維持採用 TSMC 4N 制程,CUDA Core 運算單元的數目提升幅度相當有限,加上時脈亦相差無幾,因此傳統光柵圖形運算性能只會有小幅度提升,主要的遊戲性能提升仍是來自第 4 代 RT Cores 與第 5 代 Tensor Cores,光線追蹤性能以及神經渲染運算能力大約提升了近 1 倍。
GB206 GPU 晶片規模與上代 AD106 大致相約,晶片尺寸為 181mm²、電晶體數目為 219 億個,數字與上代 AD106 非常接近。完整的 GB203 晶片包含了 3 個圖形處理集群 (GPC)、18 個紋理處理集群 (TPC)、36 個串流多處理器 (SM),總計 4,608 個 CUDA Cores、36 個 RT Cores、144 個 Tensor Cores、144 個 Texture Unit 及 48 個 ROPs 單元。
GB206 GPU 還包括 72 個 FP64 核心(每個 SM 配備兩個),這些核心並未在上圖中描繪。此外,FP64 的 TFLOP 速率是 FP32 操作 TFLOP 速率的 1/64,並包含少量 FP64 核心及極少量的 FP64 Tensor Core,以確保任何包含 FP64 代碼的程式能夠正常運行。
GeForce RTX 5060 採用經刪減的 GB206-250 晶片,僅包含 3 個圖形處理集群 (GPC)、15 個紋理處理集群 (TPC)、30 個串流多處理器 (SM),總計 3,840 個 CUDA Cores、30 個 RT Cores、120 個 Tensor Cores 及 120 個 Texture Units;GPU 預設時脈為 2,280MHz、Boost 時脈為 2,497MHz,最高 TGP 為 145W。記憶體採用了 28Gbps 的 GDDR7 顆粒,配備 128-bit 記憶體介面、總頻寬為 448GB/s。
值得注意的是,GB206 僅支援 PCIe 5.0 x8 介面,如果使用在 PCIe 3.0 舊平台只能運作於 PCIe 3.0 x8,有機會引致 PCIe 頻寬不足問題令性能略為下降,建議搭配 PCIe 4.0 或以上的主機板使用。
GeForce RTX 5060 vs GeForce RTX 4060
Graphics Card | GeForce RTX 4060 | GeForce RTX 5060 |
GPU Codename | AD107 | GB206 |
GPU Architecture | NVIDIA Ada Lovelace | NVIDIA Blackwell |
GPCs | 3 | 3 |
TPCs | 12 | 15 |
SMs | 24 | 30 |
CUDA Cores / SM | 128 | 128 |
CUDA Cores / GPU | 3072 | 3840 |
Tensor Cores / SM | 4 (4th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 96 (4th Gen) | 120 (5th Gen) |
RT Cores | 24 (3rd Gen) | 30 (4th Gen) |
GPU Boost Clock (MHz) | 2460 | 2497 |
Frame Buffer Memory Size and Type | 8GB GDDR6 | 8GB GDDR7 |
Memory Interface | 128-bit | 128-bit |
Memory Clock (Data Rate) | 17 Gbps | 28 Gbps |
Memory Bandwidth | 272 GB/sec | 448 GB/sec |
ROPs | 48 | 48 |
Texture Units | 96 | 120 |
L1 Data Cache/Shared Memory | 3072 KB | 3840 KB |
L2 Cache Size | 24576 KB | 32768 KB |
Video Engines | 1 x NVENC (8th Gen), 1 x NVDEC (5th Gen) | 1 x NVENC (9th Gen), 1 x NVDEC (6th Gen) |
TGP (Total Graphics Power) | 115 W | 145 W |
Transistor Count | 18.9 Billion | 21.9 Billion |
Die Size | 118.9 mm² | 181 mm² |
Manufacturing Process | TSMC 4nm 4N NVIDIA Custom Process | TSMC 4nm 4N NVIDIA Custom Process |
PCI Express Interface | Gen 4 x8 | Gen 5 x8 |