作者: 小小米 時間: 2025-4-2 15:45 標題: 3060 vs 3060 ti 如果玩 AI 為主
本帖最後由 小小米 於 2025-4-3 10:28 編輯
呢兩張應該點揀.....
3060 12G vs 3060 ti 8G
主要想玩下 LOCAL AI 加 入門打機
好似話 VRAM 多 AI有著數....
但在二手市場價錢差唔多, 應該點揀?
update: 如果要求唔高, 玩 AI LOCAL 可以等下, 慢小小都唔緊要, 係咪即係玩 3060 12GB 好些?
謝謝CHING
作者: vinsai 時間: 2025-4-2 15:48
冇10GB以上唔好玩AI
依家12GB都少
作者: kenken33 時間: 2025-4-2 15:50
得12G 都冇得點AI 起碼都要16G,但打機效能3060就差60TI好遠下
作者: jerry2016 時間: 2025-4-2 17:44
5070ti
作者: Kin_2012 時間: 2025-4-2 18:14
呢兩張應該點揀.....
3060 12G vs 3060 ti 8G
主要想玩下 LOCAL AI 加 入門打機
好似話 VRAM 多 AI有著 ...
小小米 發表於 2025-4-2 15:45
要玩 AI, vram 越多越好
二選一, 就一定係買 12GB 果張
作者: abcjerry 時間: 2025-4-2 19:52
算啦..VPN用GEMINI啦
作者: ki_cat 時間: 2025-4-2 20:12
本帖最後由 ki_cat 於 2025-4-2 20:48 編輯
訓練就唔駛唸,GEN下人地訓好,服務商唔俾GEN既簡單NSFW圖都可以
作者: joecn 時間: 2025-4-2 21:06
小的用RTX 5070 TI 16GB, 來畫工業繪圖, 因軟件支援Nvidia cuda AI
作者: Sinair 時間: 2025-4-2 21:18
工作用最少4070ti super
12gb要求高少少真係會爆
4060ti 16gb只能入門 16gb能做到嘅野黎講 速度實在太慢
隨便玩下gen圖 8gb都可以嘅 出512*512應該唔會爆 之後再超分 效果可以自娛
如果要玩deepseek果種 就唔好用nv gpu 直接用amd 新apu 最少上64gb ram
作者: singlag 時間: 2025-4-2 23:21
12g 8g 都係唔夠用
Llm 反應正常少少的最少都要14b 以上,禁已經要16GB vram, 但都蠢過 chatgpt 果 d 唔少
要 load 得哂70B model, 用 mac 或 ryzen ai max 加盡 ram, 推理時 token/sec 會比 load 唔哂入 vram 的 gpu 仲快,始終普通 pc 個 memory bandwidth 太慢
via HKEPC Reader for Android
作者: Kin_2012 時間: 2025-4-3 00:42
如果係 24GB / 32GB 就吸引
作者: netmen 時間: 2025-4-3 11:11
其實加Ram係最易提升效能的手段 , 就係咁樣限住我地....
作者: 小小米 時間: 2025-4-3 15:40
唔明
作者: ki_cat 時間: 2025-4-4 02:27
以前廢卡成日有多RAM版本,點人買
自從有AI流行之後,RAM即刻變成貴重資源.
作者: HKF91 時間: 2025-4-4 16:45
本帖最後由 HKF91 於 2025-4-4 16:50 編輯
3060 12G vs 3060 ti 8G <---除非本身已經有卡玩下AI無所謂, 突登俾錢買呢d同倒錢落海無分別
入門最好16G 但只係基本入門!!都有夠慢的 32G先夠玩到下d大食少少模型
家陣d人玩AI局用N卡CUDA, 全世界都知道AI唔夠RAM問題 , 但我就唔加俾你 你真係吹佢唔脹? 之後佢另外出DGX Spark ` DGX Station賣到貴一貴又只係岩岩好夠你用下想再多d RAM運算? 再買多部串埋佢啦 , 有本事你唔好買

佢敢出顯卡有128GB 256GB 512GB 1TB一定勁多人買
所以10樓講既係真 用 mac或 ryzen ai max 加盡 ram 跑可能更化算 , 起碼你有機會玩到32G以上既模型 (原版AI模型幾百GB既就唔好諗啦)
作者: Sinair 時間: 2025-4-4 18:28
回覆 15# HKF91
講得用NV GPU去跑AI 肯定係跑圖 即FLUX/SD果類
而你講嘅係Llm 用途唔同 無64GB RAM 就唔好搞AI了
一粒ai max+ pro 395 $5000以上 128GB RAM $3100
成套野埋單$10000以上先行到70b...仲未計電費同時間 再加埋溢價 現階段都係唔太抵 有錢佬玩意
真係要化算 直接比錢線上版好過
作者: ki_cat 時間: 2025-4-4 19:29
本帖最後由 ki_cat 於 2025-4-4 19:42 編輯
SDXL 12g 去Civitai用人地MODEL,GEN下D 1024x1024圖仔係可以.
Flux甚至整片果類,據說都有D版本改到,用埋系統RAM幫手,都無唔得既.
但落到系統RAM,肯定勁慢
訓練就唔駛點唸.
LLM有D低B模型,可以當體驗版試玩下,
甚至有D翻譯模型俾你12G行到.據說效果還好.
https://github.com/SakuraLLM/SakuraLLM
當了解下件事係點,實用搵食唔好唸.
有興趣再花大錢.
作者: kenken33 時間: 2025-4-5 02:27
本帖最後由 kenken33 於 2025-4-5 02:30 編輯
ai max+ pro 395 只係叫做開到但慢到爆根本唔實用,你只要開到用大容量M系mac 機連671B都跑到添
70b 要性價比就5090D+張5080/5070TI 有20token/s到 或者魔改4090
作者: joecn 時間: 2025-4-5 02:33
本帖最後由 joecn 於 2025-4-5 02:35 編輯
AMD 的新CPU max 395很厲害, 行到128GB, 可用分給內顯做ram, AI會不會比RTX 5070 TI好用? 小的現在用Ultra 9 285K, 64GB + 2TB, RTX 5070 TI來畫工業繪圖, 因其支援cuda, 但用max 395配到128GB, 軟件是否支援?
作者: Sinair 時間: 2025-4-5 08:30
回覆 18# kenken33
主要係好多人連AI有分別都唔知 搞亂晒
395速度係慢 但PC家用只有佢用到同最快 MAC其實都係差唔多速度
如果真係有必要本地部署 我覺得都可以一試
5090就算魔改到 64GB 都係開唔到70B 係LLM方面都係無性價比可言
應該分開兩樣野黎討論
作者: s84292 時間: 2025-4-5 10:03
本帖最後由 s84292 於 2025-4-5 02:09 編輯
AMD 的新CPU max 395很厲害, 行到128GB, 可用分給內顯做ram, AI會不會比RTX 5070 TI好用? 小的現在用Ultra ...
joecn 發表於 2025-4-4 18:33
行到 同 快唔快係兩件事
頂多係4070個級數
冇CUDA 已經差好遠
作者: kenken33 時間: 2025-4-5 13:12
本帖最後由 kenken33 於 2025-4-5 13:39 編輯
差好遠例如m3 ultra 超過 800GB/s memory bandwidth 去到RTX 5080 都只係960 GB/s
AMD 果部只係256-bit 既普通LPDDR5x RAM 同上面真正顯存速度冇得比
【速度媲美官网?满血M3 Ultra推理6000亿参数DeepSeek R1】 https://www.bilibili.com/video/BV1nkRnYTEWx/
70B 量化後40G 左右,5090 32G +張16G既卡就夠
另外AI比較低成本訓練一個玩法就係2張3090 NVLINK
作者: Sinair 時間: 2025-4-5 15:38
回覆 22# kenken33
满血版M3 Ultra运行DeepSeek R1模型的速度为15.78 Tokens/s
此次测试的满血版M3 Ultra配备了512GB统一内存,总价为74249人民币。
在AMD的发布会上,模优优科技讲解了用锐龙AI Max+ 395的iGPU,运行DeepSeek-V2 236B模型的生成速度达到了12+ Token/s。
要70K人仔 我見識少 未玩到咁高端
唔多覺有同版本嘅BENCHMARK直接開放比較唔同機嘅處理速度
ASUS 395 LAPTOP R1 70B Q8 4+ Token/s
山寨機跑R1 70B Q8 3+ Token/s
我覺得有10+ Token/s已經可以流暢使用 AMD仍需努力
395應該拎黎跑32B 有12+ Token/s
但32B 顯卡都玩到又快好多...
想問下有無兩張顯卡跑LLM教學?
之前搵過跑FLUX 但又麻煩又唔實用 同兩個平台無分別咁滯
作者: 36551035 時間: 2025-4-5 16:59
本地化部署,3080都唔夠
作者: singlag 時間: 2025-4-6 13:20
本帖最後由 singlag 於 2025-4-6 13:23 編輯
[attach]2472649[/attach]
M3 ultra 512MB, 行 llama 4 400B 有50token/sec
作者: kenken33 時間: 2025-4-7 12:45
本帖最後由 kenken33 於 2025-4-7 12:52 編輯
https://apxml.com/posts/llama-4-system-requirements
Maverick除左APPLE 冇10萬內消費機跑得到,APPLE冇做M4 ultra下代就直接係M5 ultra 估計最大起碼都可以升級到1TB RAM ,Scout 最基本都要一張H100
作者: ki_cat 時間: 2025-4-8 15:50
本帖最後由 ki_cat 於 2025-4-8 16:16 編輯
好耐無gen圖,係度吹左一陣,心眾來潮玩翻兩日.
發現依家d人主流都係玩sdxl,不過係改既pony,又幾好玩.
某d二人動作,以前control net搞一輪,依家直接打落去,狂出.
動不動就出J圖,直頭要負面詞加nude.
flux唔知係大食定用自然語,難整loar,仲係無咁多人玩.
via HKEPC IR 5.1.14 - Android(5.1.2F)
作者: s84292 時間: 2025-4-10 11:28
pony好耐冇大更新
你要玩我建議你試下sdxl illustrious,最好直接試vpred
SDXL真正的新生
我D LORA 訓練轉晒去sdxl illustrious
推薦你呢個模型變體
https://civitai.com/models/989367/wai-shuffle-noob
作者: ki_cat 時間: 2025-4-12 16:32
謝
illustrious穩定同聽話,穩定到有時太似.以為無SET Random
出多手果D都小左
作者: billykhw 時間: 2025-4-14 09:23
依你問題
你應該揀3060 12GB
3060ti快D係快D
但8GB gDDR係唔夠你玩AI,好多野會限住
作者: 小小米 時間: 2025-4-14 13:20
除左...3060 12GB , 仲有咩好性價比的選擇?
作者: billykhw 時間: 2025-4-14 22:20
冇
4060ti 16GB就算俾你搵到有貨都要三千幾
唔值
二手既話又要3080先至有12GB,但又係三千幾
二手3060 12GB千幾蚊就有
要平玩真係得佢揀
作者: vinsai 時間: 2025-4-15 09:49
試下搵大陸嘅2080ti 22G (魔改)
作者: 返工搭巴士 時間: 2025-4-22 19:52
想問下如果用來AI生成字幕
兼AI低清影片變高清
用3060 12G 好定 3060TI 好?
如果3070魔改16G 會唔會有問題?
作者: abyss 時間: 2025-4-22 23:54
3080賣3k幾擺明水魚價,4070都係3k俾多幾舊有s
作者: sirisulu 時間: 2025-4-23 00:57
同意樓上師兄講直接 2080Ti 魔改 22G 足夠戰多三年以上
作者: s84292 時間: 2025-4-23 09:42
本帖最後由 s84292 於 2025-4-23 01:52 編輯
5060TI 16GB
AI方面行到FP4,GDDR7又快一截
大語言AI唔行FP4靠16GB GDDR7 性能快過4070
5060TI 都貴!? 不如去租雲端好過,租錢仲平過交電費


睇唔開可以試下買INTEL 張B580 12GB,但INTEL +12GB 真係好多限制
作者: zgmfx12a 時間: 2025-4-23 09:55
回復 37 #s84292
而家食炒價, 5系又咁多defect, 平平地入張3060 12GB 未嘗不可
via HKEPC Reader for Android
作者: kenken33 時間: 2025-4-24 00:41
玩AI唔肯落本,要性價比就R 免費線上版算啦
作者: kirafung 時間: 2025-4-24 09:58
新手想試玩AI 其實點樣開始好
目前階段只係 ollama 行個model
作者: singlag 時間: 2025-4-24 11:57
本帖最後由 singlag 於 2025-4-24 12:04 編輯
如果只係要打機有3060 速度,去淘寶買張 amd mi50 32GB, 只係1千蚊。。。
但有32gb vram + 1024GB/s bandwidth 的 HBM vram, 行 ai 會快過3060 好多,因為 vram 多 + bandwidth 超高 (行gddr7 的5070ti 都只係8xx GB/s)
插2張有64gb vram 都係2千蚊,行 llm load 大 model 一定快過得12-16GB 的 gpu, 仲平幾倍
單張32gb 玩 gen 圖都方便唔少,行 ai 野始終 vram 要多 + 高 bandwidth
via HKEPC Reader for Android
作者: POE100 時間: 2025-4-24 12:40
本帖最後由 POE100 於 2025-4-24 12:50 編輯
我用3060 12GB
Load 到LLM 中低level
VRAM 大細一定喺首選
那怕喺1 token/S
因為入門任何事首先你要有張display card
作者: rfdingo 時間: 2025-4-24 12:44
如果只係要打機有3060 速度,去淘寶買張 amd mi50 32GB, 只係1千蚊。。。
但有32gb vram + 1024GB/s bandwi ...
singlag 發表於 2025-4-24 11:57
amd mi50 32GB
大陸人都話 由720炒到成1000 ,無cp可言
作者: singlag 時間: 2025-4-24 14:40
回復 43 #rfdingo
1千蚊買到咩卡有 32GB vram + 1024GB/s bandwidth ?
via HKEPC Reader for Android
作者: kenken33 時間: 2025-4-24 14:53
本帖最後由 kenken33 於 2025-4-24 14:57 編輯
如果只係要打機有3060 速度,去淘寶買張 amd mi50 32GB, 只係1千蚊。。。
但有32gb vram + 1024GB/s bandwi ...
singlag 發表於 24-4-2025 11:57
張卡零風扇連渦輪扇都冇把你家用點行
又唔係放2u server,人地係server用暴力扇直接吹穿風道作者: rfdingo 時間: 2025-4-24 15:00
[quote]回復 rfdingo
1千蚊買到咩卡有 32GB vram + 1024GB/s bandwidth ?
via HKEPC Reader for Android ...
singlag 發表於 2025-4-24 14:40
[/quote小]多係多,但要入Linux玩先可以完全發揮性能呢
作者: singlag 時間: 2025-4-24 15:36
回復 45 #kenken33
自己加把風扇咪得
via HKEPC Reader for Android
作者: singlag 時間: 2025-4-24 15:37
本帖最後由 singlag 於 2025-4-24 18:15 編輯
回復 46 #rfdingo
呢個年代裝個 linux 都好自動化,唔識 cli 都可日常使用 la
普通 windows 打機,6舊水張16gb 版有大約3060 的性能,算抵玩la
via HKEPC Reader for Android
作者: kenken33 時間: 2025-4-24 19:43
你咪試下囉,冇熱管鋁片用普通扇壓300W

作者: singlag 時間: 2025-4-24 21:04
回覆 49# kenken33
入邊係大銅底 heatsink +另一組獨立熱管heatsink 幫供電散熱
本身係 server 卡裝入 server 咪又係靠機身高風壓做對流散熱
full load 時風扇嘈就大把卡會嫁 la, 唔鐘意咪改水冷
https://www.bilibili.com/video/BV1Wk4y1E7sZ/
作者: POE100 時間: 2025-4-28 22:01
回復 rfdingo
呢個年代裝個 linux 都好自動化,唔識 cli 都可日常使用 la
普通 windows 打機,6舊水張16gb ...
singlag 發表於 2025-4-24 15:37
6舊水張16gb~ 3060
例如??
作者: rfdingo 時間: 2025-4-28 22:52
佢講緊 mi50 既16G 版
相對32G版, 16G版係 比大陸仔 完善/調整 左好多, 有d 賣既甚致刷好bios 直接可以當獨立顯卡用..
作者: POE100 時間: 2025-4-29 13:06
點解要咁做?買佢多數用嚟打機定畫圖多?照計唔會做AI掛?
作者: raylee 時間: 2025-4-29 13:48
這張太慢嗎?
https://www.jumbo-computer.com/p ... -16g-1clickoc-2x-bk
作者: kenken33 時間: 2025-4-29 21:25
開源又出左個qwen3



作者: ki_cat 時間: 2025-4-30 17:14
唔係最多人吹,試呢個30b-a3b,呢個依家求其一部機都用得.
作者: 扣肉 時間: 2025-4-30 22:20
用openrouter 試左Qwen: Qwen3 30B A3B, 效果唔錯, 都想買張卡在ollama 行
作者: kenken33 時間: 2025-4-30 23:52
235b a22b 借多近120G D5 RAM都叫行到,顯卡VRAM果度食4XG 。

作者: kai026 時間: 2025-5-2 04:02
搭單問下
想做到用stablediffusion roop之類做到愛情動作片換面12gb vram夠唔夠
一手卡上到16都好貴下
via HKEPC Reader for Android
作者: ki_cat 時間: 2025-5-2 16:37
本帖最後由 ki_cat 於 2025-5-2 17:39 編輯
呢D睇你片幾清幾長.正常幾秒應該都夠既,快慢問題,但RAM最好上32G,我唸
