Re: [情報] 4090接招!AMD RDNA3大核心GPU玉照搶
※ 引述《ultra120》之銘言
: 按計劃AMD將於時間11月4日早上4點
: 召開RDNA3新品發布會,預計推出RX 7000系列顯示卡。
: 趕在這之前,疑似Navi 31大核心的RDNA3架構GPU玉照搶先曝光
: 圖中可以看到中間是一顆大的GCD單元,周圍環繞6顆小的MCD單元
: 外界預計晶片面積533mm 2,封裝面積55 x 47.5 mm (2612 mm 2 )。
: 事實上就在昨天AMD CEO已經確認RDNA3 GPU採用5nm,Chiplet小晶片設計
: 有著巨大的性能提升和能效提升
: 爆料預計Navi 31擁有12288個處理器,96MB無限快取
: 搭配GDDR6,其中RX 7900 XTX是24GB 384bit。
: 希望RDNA3能給NVIDIA RTX 40系列造成衝擊
: 最終的性能和售價,我們拭目以待。
: 來源 https://news.mydrivers.com/1/869/869907.htm
: XF編譯 https://www.xfastest.com/thread-268699-1-1.html
: https://i.imgur.com/RTgIWme.png
可是蘇媽的顯卡都有一個很大的問題,就是深度學習,尤其是tensorflow,A卡跑起來問題真
的很大,我覺得老黃現在賣顯卡除了一般玩家外,另一個客群就是深度學習的客群,很多企業可能不想花更高的成本,跑神經網路
那4090,4080其實就是還不錯的選擇
現在要跑深度學習一定離不開N卡,希望A卡能加油,讓未來的深度學習也能有便宜的A卡用----
Sent from BePTT on my iPhone 12 Pro
--
蠻難的 不能跑CUDA 又晚發展 註定是條好漢坡
CUDA深耕多年 這部份大概難追了
早就是NV的形狀惹
蘇媽主打的是純遊戲玩家吧? 這次如果定價贏,跑遊戲
2K也能追上4080,那就很ok,至於4K沒DLSS黑科技,這
塊玩家少放生也沒差,主力2K+定價贏4080,滿有競爭力
的
ROCm的hip就是要CUDA相容,但目前ROCm的毛還很多,相容好
的instinct又買不到。AMD真的需要多投資源在Radeon上
遊戲卡當深度學習卡的市場應該也沒有很大吧(?
先把遊戲卡跟深度學習卡單獨搞好 避免兩頭空?
amd這塊幾乎放棄了吧,前個月不是有新聞,承認追不上nv,
就專注遊戲市場
問題是遊戲玩家搞Driver問題會森氣氣
DL這塊追也追不上了吧 把能做的地方做好就萬幸了
所以低價單就摸摸鼻子買30庫存 高價單就買40系列
你看Stable Diffusion多熱門,你radeon不支援,所有美術就
全跑去N家了。這塊只會越來越大,A家真的要多投資源
老黃G80就架構大改要朝這個方向走了,真的有遠見
深度運算就NV場子
可是各家顯卡評測只會測遊戲,誰知道A卡深度學習怎樣,只
有自己買來測才知道.....
ML 這塊大宗都會在雲端, 消費性產品沒什麼市場
rocm最新版的好像改進很多
老黃不可能讓尼遊戲卡爽跑ML 沒啥意義
DL/RTX voice/dlss/CUDA加速/nvenc都是我個人願意
多付一點錢買相同遊戲性能卡的原因
遊戲卡爽跑ML的意義喔 綁生態阿 窮學生跟一般想玩玩ai
的隨便買張便宜的遊戲卡就能跑跑基本的東西了 跟MS玩法
一樣啊 你習慣這生態以後就綁死了
會跑ML的學生市場沒有很大喇 想太多惹
而且老黃AI卡營收已經快要到一年20b的境界
大客戶只要到2b的規模一定會想自主開發
1b的規模在現在要不要自製還有點微妙 2b就不會問惹
學生又不是賺那小小的卡錢 是養這個人把整個生態系綁著
在cuda而已 非cuda的ai 開發者到底有多少
不要小看一年20b的規模R 這擺脫cuda的吸引力很大
現在是16b喇 按預估如果老黃獨占態勢不變的話
五年後恐怕會超過40b 半導體各大市場僅次於手機晶片
所有cloud/ai大戶都在為五年後座準備
老黃會開始築專利壁壘 這點倒是不用懷疑
老黃早轉向了,玩家他不在乎,AI才香
那不是專利壁壘的問題 老黃賣一片賺十片
牙膏one api也都盡量去吃cuda豆腐了 不就整個生態系太龐
大搞到不這樣玩也沒多少人會寫了 各種花式自動轉code
成本不知道有沒一千鎂的ai卡他要賣上萬鎂
他大概會把你自研Certainty equivalent拉高
現在已經不是玩自動轉code而已惹 花招聽說越來越多
專利壁壘可能太過 實際上就是拉高成本脫台錢讓你追
過陣子大概各大戶會把底下ML工程師workload有沒擺脫
老黃當績效
然後把生態系弄越來越大 讓你擺脫不掉像軟軟那樣
總之有很多複雜問題
是各種招 但是軟體問題也沒那麼單純 要解決的成本也不低
重點是有這樣技能組的人也沒那麼多
沒辦法保證說老黃一定會廢 因為大軟公司的晶片部門
塞滿一堆過太爽都在混的人
尼把績效考核放上來 工程師就會乖乖作惹 獎金問題
大軟公司在衝的時候會把人關進war room 做完領錢
講到晶片部門 媽的剛剛爬文才發現教主以前會推
一拿就是幾萬鎂
你派個小組專門幫stable diffusion,這些開源專案移植,
花不了多少錢。市場馬上擴大許多,有時學生不在乎跑得慢
可是效率有CUDA這麼好嗎 從頭來過最後回頭的也不少
但要能跑。A家花點時間起碼能跑,性能可以以後再說。這塊
再不投資,市場真的就全部被搶走
各大公司晶片部門基本上目標都是三五年後
學生不在乎跑得慢 可是市場也不大 商用市場才肥
而且work load最佳化只有自家知道 老黃沒辦法
他悶當然認為很有機會跑贏老黃卡
老黃卡理論能耗效能真要比 其實真的就普普
可能要再觀察CUDA舒適圈到底多暖
我聽G社學長講的 非本人立場
a卡(ROCm)也可以跑tensorflow、pytorch,只是穩不穩就是
另外一件事情了
老黃cuda舒適圈其實是enterprise這塊不是cloud惹
enterprise客戶規模不可能自製 完全被綁死
蘇媽那邊就真的沒啥人能帶大軟專案
而且比較認真作軟的raja又跑去牙膏自殺
build team不是說尼隨便底下找群人來弄就好
帶的人搞不清楚狀況 就是先胡搞瞎搞
外面挖人進來弄也可能走上同一條路
這一波人力重整看看蘇嬤要不要順便整理一下組織
蘇媽策略已經講惹 他跟M軟合作 卡便宜賣
軟體尼想辦法
M軟也知道自家晶片部門沒幹過大事 跟蘇媽合作省事
當然這種事情很機掰 蘇媽想偷學 M軟想防
玩得起的只有那幾間 但是Cloud這部分還得看營收到底怎麼
M$這兩年錢太多戰場開好多
分成的 你自家商用的AI能靠自家人努力轉是沒差 但這部分
到底佔比多大? 客戶的東西不太可能讓你花人來幫忙改
最後人家還是乖乖跟你租Cuda Server跑Cuda而已
除非真的能做到100%相容 但很難
以前的數據cloud是佔中央八成
重點是軟體不是無痛上 不是你家的軟體要怎麼幫人家改
而且大戶像估狗買老黃主要是自用 出租的比例還不高
當然五年後會怎樣還很難說
這東西就跟x86轉arm server有點類似
有的人好轉 有的人難轉 有的人不敢轉
軟軟太大惹不同部門都不知道發生啥
牙膏那邊走過一次了 問題也是蝦雞吧多的
問題是老黃實在賣太貴惹 蘇媽epyc根本白菜價
40b真的太大惹 GG幾年前營收才破50b而已
很難搞還是得搞R 都是$$$$$$
老黃價格、專利兩邊燒讓你做不起來就好了
Complier這塊至少牙膏能力還是比AMD強不少 這條路要走
說不定還走輸牙膏
沒 牙膏gpu類效能沒辦法跟蘇媽打
反正現在連生態都搞不定 根本還沒談到硬體
牙膏問題已經4完全不同層次惹
至少牙膏轉Code那邊做的應該是比AMD好不少
牙膏也是很愛吸血 然後G叔不喜歡主事的raja
問題不是只有轉code 沒人想養出第二家老黃
蘇媽遇到大戶姿態都很低 而且沒有吸血紀錄
AMD大起來吃像也沒真的比較好看 算了吧
牙膏這些年14++++++已經吸到天怒人怨惹
AMD目前只是還不夠大而已
蘇媽就真的還沒大到可以亂喊價
但說真的 AMD每次GPU都有夠重本的 成本比人家貴那麼多
就沒這樣過 所以大戶不會這樣假設
售價又只能比人家低
目前跟蘇媽合作的公司幾乎沒聽說過抱怨價格
pc以外喇
問題是蘇嬤連遊戲Driver都零零落落
搞葛chromium硬體加速問題搞一年XD
沒辦法 軟體人才對AMD沒啥興趣吧 一堆更好的地方
專業級深度學習卡售價是20萬 30萬的
然後DP會掛驅動直接黑螢幕或Crash好像還是無解
如果沒有要訓練AI 其實消費級頂級顯卡是夠用 跑AI繪
圖的可不是人人都有這個錢啊
老黃積累的軟體壁壘是真的蠻難跨越了 不管是人還是程式
新的Radeon又不支援ROCm只能買Instinct
完全看不出AMD還有餘力建立生態系
眼光只盯著企業大戶了 是好是壞就不知道了
Open source一堆免費人力幫忙Debug是前陣子的流行
現在回去搞封閉的開發環境到底是好是壞就看結果吧
深度學習的客群在資料中心,PC玩家除了板上幾隻小貓最好有
人拿去跑DL
價格壁壘也是
NV是軟體公司(X
電源接頭都可以搞成這樣 看來真的是軟體公司
老黃是直接一個架構可以同時遊戲/繪圖/運算,而蘇嬤已
經繪圖和運算分家了,RTG想玩老黃的策略不太可能,專
注加速卡其實更好,大客戶單價高又量大,而且能發揮EP
YC的優勢
蘇媽不是已經把rx系列當成遊戲卡來經營了不是?當然跟遊戲
無關的就被醃掉了 看看fm
除非復刻gcn架構
這次發表還可以看出一些端倪是,部分功能有用上賽靈思的東
現在是i皇想玩老黃的策略,磨合到2025應該有機會,只
是pat要有耐心
西去補足,雖然說兩者分開還是有些重疊之處
只是變成部分不是原本自己的RTG部門硬幹了
現在又沒啥大作,純遊戲顯卡死得更慘,驅動還-5000
往純遊戲走還好吧,PS跟凶盒遊戲機先顧好
amd 加油 好嗎
最好遊戲機都膠水黏一黏,賣便宜一點
不久前還在嫌遊戲與專業計算混合讓顯卡很熱的
拼裝品就算了,結果FSR3與HYPER RX 明年才實裝,有沒有這
麼遜
拜託AMD給點力,NV卡在Linux上就是雞巴毛一堆煩死
這輩子大概是等不到NV支援Wayland了
L 托瓦茲: NVIDIA, Fxxk you
天下苦老黃久已!
沒 wayland 也不會怎樣吧,就繼續用 Xorg
NVIDIA 的 EGL 有做 dmabuf extension 了
雖然只有做一半,但是至少不是完全絕望 XDD
叫組人去幫忙維護ffmpeg編解碼,硬體支援軟體跟不上也沒用
支援av1編解碼就講好聽的,實際上機跑跟in差太多
264.265.av1一路爛,到底有沒要改進的意思
還好畢業不用跑cuda了,以後有便宜的A卡用
難,生態系都建好了
蘇媽做GPU只是為了吃Console的市場吧?其他就放飛了
AV1編解碼還是i皇最用心了
看下來怎麼好像各家弱項被噴一遍...
AMD driver在Linux上好像也沒比較好...之前用一個
Linux rescue LiveCD,跑了6個開源Driver全部Fail
最後還是跳成終端機模式
那個要看是哪張卡,kernel 版本、linux-firmware 版本、
mesa 版本。
燒起來成本更大
44
[菜單] 100K深度學習主機已買/未買/已付訂金(元):未買 預算/用途:100K 實驗室深度學習機 CPU (中央處理器):Intel Core i9-12900K NT$ 17700 MB (主機板):華碩 TUF Z690-PLUS WIFI D4 NT$ 7990 RAM (記憶體):金士頓 32G*2 D4-3600 NT$ 6,88042
[閒聊] 有沒有深度學習訓練出來的boss深度學習最有名的例子 就是之前下圍棋那個阿法狗 簡單來說 就是根據不斷的嘗試 找出處理問題的最好解法17
[菜單] 140K 深度學習遊戲機已買/未買/已付訂金(元):未買 預算/用途:140K以內 / 深度學習與遊戲機(黑色沙漠、NBA2K、3A大作) CPU (中央處理器):AMD R9 7950X 盒【16核/32緒】4.5G(↑5.7G)175W/64M/5nm RDNA2內顯/原生PCIe5.0 $22950 MB (主機板):微星 PRO X670-P WIFI(ATX/1H1P1C/Realtek2.5G+Wi-Fi 6E/註四年)14+2+1相供電 $10888 RAM (記憶體):Kingston 16GB*2 DDR5-6000/CL36 FURY Beast Black (獸獵者)【具XMP、EXPO參數】*2 $1376012
[菜單] 62K深度學習機已買/未買/已付訂金(元):未買 預算/用途:62K深度學習機 CPU (中央處理器):AMD Ryzen™ 7 5700X MB (主機板):MAG X570S TORPEDO MAX RAM (記憶體):Kingston KF432C16BB/32 兩支12
[菜單] 40K 深度學習機最近運算實在太重了,決定自己買台回家用,不然用雲端累積下來的錢真的太可怕,如果有更好的選擇的話可以小爆運算,麻煩大家了! 已買/未買/已付訂金(元):無 預算/用途: 1. 跑深度學習,著重於 GPU 上,選 3060 是考量了有 12G 能用 2. 偶爾會跑機器學習,希望 CPU 堪用11
[菜單] 90k上下 深度學習機已買/未買/已付訂金(元):未買 預算/用途:90k上下 / 跑深度學習(StyleMapGAN) CPU (中央處理器):Intel Core i7-12700 $10250 MB (主機板):微星 MAG H670 TOMAHAWK WIFI DDR4 $5790 RAM (記憶體):威剛 ADATA XPG D10 DDR4-3200 32G(16G*2) $30889
[菜單] 50K 深度學習機已買/未買/已付訂金(元):未買 預算/用途:深度學習 遠端使用 CPU (中央處理器):AMD【8核】Ryzen7 5800X 3.8GHz(Turbo 4.7GHz)/ZEN3/8C16T/快取3 6MB/105W/無散熱器/代理商三年 MB (主機板):華碩 TUF B550M-PLUS(mATX/1H1DP/M.2*2/8+2相供電/4層板/註冊五7
[菜單] 55K 深度學習機已買/未買/已付訂金(元):未買 預算/用途:深度學習跑AlphaFold 先前有在板上問過一次, 有稍微升級過並挑選大哥卡 CPU挑有內顯的避免顯卡壞掉就沒畫面 MB就隨便選一塊6
[菜單] 37K 不含顯卡深度學習機預算/用途:深度學習 CPU (中央處理器):13700K MB (主機板):TUF GAMING Z790-PLUS WI-FI D4 RAM (記憶體):PNY DDR4 32G 3200*2 2200元*2 VGA (顯示卡):