Re: [請益] 1660S x2 or 3070 組DL server
※ 引述《yoyololicon (十年魔乃粉)》之銘言:
: 乳題
: 最近想組個機器跑些DL的project
: 因為是自己玩玩的性質,所以都找些二手零件壓成本
: 用的是四代平台4790S + 8G 1866 x4,電供650w
: 最重要的顯卡預算大概是15k上下
: 目前最符合條件的感覺就3070
: 不過以前在學校跑DL的經驗,有兩顆gpu跑平行會快很多
: 所以想乾脆用兩隻1660S來組,記憶體還可以上到12G
: 但是就沒有Tensor core可以玩了qq,也不確定這樣組的效能是否可以追上3070
: 還請版友給個建議
最近版上出現一些深度學習配單,覺得有一些心得可以分享,省的走冤枉路
就來回一下舊文,我最後拿3070喇
先說結論,3060 cp值最高唯一推薦,再上去建議直接攻頂3090
大部分人買顯卡都很關心效能,所以我看到有些人會拿3070, 3060ti上來問
但是跑深度學習除了效能以外,VRAM大小以及資料讀取的IO時間都會影響training效率
VRAM影響能跑得模型大小、類型,或是能一次塞入的資料量,可以想成和運算量成正比;
而資料讀取的時間影響你能在多短的時間內拿到可以訓練的資料
從我去年11月買了3070後,這之間多多少少訓練過一些模型,算是有一些心得
觀察下來其實大部份的時間3070很難完全跑滿,看模型類型,有時甚至30,40%而已
為什麼沒有跑滿?因為卡在資料進來的速度,跟CPU,硬碟和主機板比較有關
但只要組的等級有到基本差別不大
而且這是已經優化過資料讀取的pipeline後的結果
沒辦法,只好增加顯卡的運算量,看能不能善用這些idle的時間
但這時就會發現,8 Gb的VRAM根本就小氣到不行,一下就塞滿了
相比之下,3060 12Gb就很值,雖然效能較差,但以3070完全效能過剩的表現來看
更有機會能發揮100%的效能
舉個實際的例子,小弟最近參加了一個跟AI相關的比賽,很幸運的撈到了銅牌
https://github.com/yoyololicon/music-demixing-challenge-ismir-2021-entry
其中一部分的模型就是用3070練出來的
為了讓GPU跑到滿,自己改了一個dataloader加速資料讀取速度、使用混合精度訓練
節省記憶體、將資料preprocessing改寫移植到GPU上讓它多一些運算
做了這麼多改動才好不容易讓GPU能跑在95% Orz
而且為了跑到預定的batch size大小,還得做gradient accumulation
如果有大VRAM就可以train比較無腦一些
大概醬
--
preprocessing用GPU做會比較快嗎
推分享
都是純數值運算的話,當然會比較快
神人@@
推概念。記憶體不夠很麻煩
真的想做ML要節省時間買兩三台電腦
比較實在,但說真的VRAM大小很吃重
所以我們公司一率上泰坦XD
88
[情報] 聯想經理:別等 4060 效能+ 20% 價格更貴對於預算有限,又想要換最新一代顯卡的玩家來說 一定都在等 NVIDIA GeForce RTX 4060 這張 明年才會推出這大家都知道,只不過規格 效能如何?過去都沒有什麼消息,最近中國終於有人爆料 而且還是聯想中國遊戲主機經理44
[請益] 3080 VRAM溫度高成這樣~怎麼會是挖礦首選?小弟菜逼巴一枚 問一個弱弱的問題 3080使用的GDDR6X 隨便一開挖就100度以上 就算DIY透過改散熱貼 頂多降低個10度內32
[情報] 太狂喇 i皇Arc獨顯跑分超越老黃3070 Ti喇根據VideoCardz消息 SiSoftware上已經出現了i皇Arc獨顯的跑分了 這張卡是滿血版的512EU DG2-512核心 時脈部分為2.1GHz 時脈這個不是越高越好 看看蘇媽6500XT都快3G結果跟垃圾一樣25
[情報] Intel 顯卡效能接近 RTX 3070DG2-448EU 從規格上來看它應該是從 DG2-512EU 上精簡而來的,用的是同一個 GPU,效 能也有爆料,GPU在 1.8GHz 時脈時它的效能大概是 RX 6700XT 的92%,比 RTX 3070 慢5 %左右,不過他沒有說明具體來源,也不太清楚這是什麼測試軟體的效能。同時也透露了 DG2-128EU 的效能,它運行時脈 1.9GHz 時比 GTX 1650 快12%。25
Re: [情報] RTX3060 12GB 效能解禁囉~~~~~那個老黃是不是太佛心了 因為市面上卡不夠多,所以希望2060/2060s的玩家不要換卡惹 3060根本就跟2060s差不多的遊戲效能阿 大概就是3060=2060s=2070 雖然MSRP差了$70,但實際上看起來市面上零售通路價格大概只比3060ti少了15%上下而已20
[菜單] 50k 四張顯卡的AI訓練主機(已有顯卡)已買/未買/已付訂金(元): 已買4張顯卡(1060、1070、2060、2070) 預算/用途:50K內/公司的AI模型訓練主機 CPU (中央處理器):Intel i9-10900X【10核/20緒】3.7G(↑4.5GHz)/19.25M/165W /無內顯【代理盒】, $19900 ★ MB (主機板):華碩 WS X299 SAGE(CEB/8*D4/雙I網/2*M.2/2*U.2/三年)12
[情報] 3080 Ti量產版評測:除了蒜粒幾乎不輸3090b站有人跑了3080 Ti正式版評測 GPUZ資訊7
[情報] 3070魔改16G:效能小提升 挖礦也能挖根據俄羅斯的Youtuber VIK-on的最新影片 等等 你說很熟悉ㄇ 沒錯ㄉ啦7
Re: [閒聊] Vampire survivors 性能問題Vampire Survivor 效能需求應該是從兩個要素來的: 1. CPU 單核效能需求 雖然 GPU 性能日益大增,但是 CPU 的效能就沒有顯著的提升。 舉個差不多十年前頂標的例子跟現代頂標 CPU 比較(參考資料來自 Geek Bench): CPU |Intel i7-2700K(2011)|AMD 5950X(2020)