Re: [閒聊] 關於30系列的cuda core?
※ 引述《leon19790602 (())》之銘言:
: 逛了一下對岸nga,有些文章提到:
: 1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了: ,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
: 2.這次列出3090有一萬個,3080有8000+個
: 其實是不是有點類似於超線程的意思?
: 每個物理core有兩個fp32計算單元
: 所以算力大約提升兩倍?
: 實際上die里真正的物理核心只有/2這麽多?
: 是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt: 寫的性能。
: 以上,
: 分享一下不同的看法,
: 我也不是對這塊專業領域的,如果最後有錯請勿見怪。
:
前幾天NV公佈了詳細的Ampere繪圖/遊戲卡架構資料
參考:https://tinyurl.com/y4luadcm
對於30系列遊戲卡新架構的設計明瞭許多
NV這次對於Ampere繪圖架構(GA102之後晶片)的改進
我覺得可以說相當高明,新架構FP32運算效能比上代大幅度提昇
不過NV這次新定義的CUDA數量也有引起一些討論
從過往近代NV的GPU來看,每一個CUDA流處理器
通常會包含一個FP32運算單元和一個INT32運算單元
https://i.imgur.com/EjVHF1r.jpg
一共有64個FP32單元和64個INT32單元
以及8個Tensor Core和1組RT Core
共用96KB的L1快取
https://i.imgur.com/tc4e5p3.jpg
總共有64個FP32單元和64個改良的INT32單元
以及4個改良的第3代Tensor Core和1組第2代RT Core
共用的L1快取加大至128KB
這次架構奧妙之處在於加大規模改良的INT32單元
在執行INT32運算時,也能夠穿插同時執行FP32運算
有點類似像Intel CPU的超執行序調度設計
也有點像AMD過往推土機架構一模雙核(NV反過來增加浮點單元)
統計近年普遍的新3D遊戲
使用INT32的運算指令平均約佔FP32指令的1/3~1/4而已
與其讓INT32單元閒置,改良後讓它也能處理FP32運算
能夠進一步來提昇電晶體線路利用效率
這次的新架構設計,電晶體數只需增加約50%,功耗提高約40%
就能換來帳面理論值2倍的FP32運算效能
所以GA102的SM結構
若以過往一個FP32單元搭配一個INT32單元來看
和Turing一樣是每組SM有64個"CUDA"
但以FP32單元數量來看,因為INT32單元也具有FP32運算能力
NV認為可看作是128個FP32單元
也就是NV目前公佈30系列的CUDA數量了
這也解釋為何之前一些爆料者標出的CUDA規格數
實際上NV公佈30系列後的規格CUDA數卻是翻倍的
https://i.imgur.com/4C4FH8r.jpg
4352→8704 RTX3080
2944→5888 RTX3070
因為AIC板卡廠在初期拿到的資料也是用傳統CUDA數定義去計算
實際NV之後公佈的規格則用FP32單元數量來計算CUDA數
這次的設計
如果一款遊戲是大量使用FP32指令運算
那30系列相對於20系列顯卡提昇的幅度就非常大
如同NV發佈會上的效能數據
https://i.imgur.com/f0QBvZY.png
但如果遊戲中使用INT32指令的比例愈高
那麼30系列領先20系列的幅度可能會被拉近
因為30系列每組SM中仍然是64個INT32單元
從之前B站偷跑的遊戲測試影片也能觀察到這現象
https://i.imgur.com/DuipsDM.png
我覺得這次NV新架構是很有效率的設計
AMD和Intel未來的顯示卡
可能也可參考這樣的設計方向
--
QQ這篇有點燒到我 出來溫度如果不是太誇張
還真的有點想換呢
這次新架構提昇效益很大 也算是彌補了使用三星製程
比較好奇這樣的騷操作 在機器學習有影響嗎QQ?
感謝解說
推
機器學習ㄧ般情況都是FP32在運算,所以效能相對20系
列應該會顯著提升
https://i.imgur.com/rThmqsm.jpg
這是Ampere架構運算卡GA100的SM結構圖 CUDA仍然是傳統獨立一組FP32單元和一組INT32單元 另外還配置獨立的FP64單元,共用192KB的L1快取 GA100的Tenser Core負責處理FP16、FP8、FP4...運算 還可以處理FP16/FP32的混合精度運算 所以這次繪圖晶片GA102特化FP32的設計 主要提昇的是FP32的運算效能 如果使用的環境以FP16運算為重,提昇效益可能就較有限 不過這次第三代的Tenser Core效率還是會比前代架構高
解說清楚 推一個
單8pin RTX3050 效能有2070s itx
短卡,我買兩張起來供
雖然不懂 但是看到遊戲+40%就夠了
反正對一般人來說看到cuda暴增就覺得效能也是暴增
感謝解說,還以為製程提升足以讓CUDA翻倍+暴增太玄
內顯也能這樣搞嗎?
推
這次架構也幾乎是暴增了 原本int 32 跟fp32可以一起
開 但是int空閒可能太多 換成fp32完整一組 相當於
以前的兩倍了 不過對上一代增幅就稍微小一點點
等待3050不然就便宜找2060s 970該退休啦
有傳言10月就會有60了 可能中低階會比上一代的時間
差小一點點 早點出來 畢竟AMD主力會往那塊打 不可
能放空
影馳3080 5499羊 可以參考下 3080的價格了
以後遊戲廠應該會慢慢對這個優化
這代感覺太吃電,[email protected]
看遊戲嗎
不知道黑沙是吃FP32?
推
請教這篇看得出來對於影片轉檔輸出的幫助嗎
至少看起來對madvr幫助應該不小
原來是這樣 看懂了
爆
[閒聊]為何RADEON正走向失敗本篇是我做為一位消費者及硬體玩家的角度 對於該篇文章的呼應 #1Zibu60g (PC_Shopping) [情報] AMD顯卡幾十年來第一次如此慘烈市佔創新26
[情報] NV Ampere 普及RTX光追RTX3080/Ti獨享SLI對於NVIDIA下一代的Ampere GPU,昨晚的最新爆料給出的說法跟之前不同,顯示遊戲用的 Ampere顯示卡使用的是三星10nm製程,CUDA核心也沒有之前那麼誇張,但RTX 3080 Ti性 能大概會提升40%,增幅不算低了。 這份爆料出自網友CorgiKitty,從昨天到現在他還給出了更多的訊息,再來補充一下。 1、之前他爆料Ampere GPU的FP32規模會翻倍,但不代表CUDA核心數會大漲,因為NVIDIA19
[情報] 關於NV Ampere GPU 晶片尺寸,規格,架構關於NVIDIA即將推出的Ampere GPU一直是他們大肆宣傳和期待的主題。據了解NVIDIA的旗 艦GPU將擁有826mm2 的巨大Die 儘管未提及製程,但如此大的Die確實會稍微增加它使用較舊,更成熟的製程(如12NFF) 的可能性 根據台積電7nm的成熟程度,對於數量有限的限量生產,826mm2 的大晶片也不是完全不可16
[情報] RTX30 系列社群Q&A官方對社群的Q&A 簡單翻幾個有趣的 Q:為何3080只給10GB,這數字是如何決定的,這個數字與前代相比沒有進步 我們持續分析最新的遊戲、以及定期了解開發者接下來新遊戲的記憶體需求 3080的目標是在最低的價格上給你好的 4K+全開+高解析材質包 的效能9
[情報] rx7800 7600顯示卡規格根據傳聞,AMD下一代顯示卡還會有至少兩個核心,一個是高階的Navi 32,預計對應RX 7 800系列,另一個是主流的Navi 33,預計對應RX 7600系列。 AMD ROCm程式碼庫中意外洩密,披露了它倆的核心規格,分別有60個、32個運算單元,相 當於Navi 31的三分之二不到,以及整整三分之一。16
Re: [情報] 豬隊友5星7確定4060系列全搭8G VRAM其實NV主打AI是說用AI衍生的功能 例如DLSS 不是要你真的拿去跑AI 對於GeForce系列 NV應該是超級想要閹割AI跟CUDA“運算”能力 去逼你買貴好幾倍的專業繪圖卡或是專業運算卡 其實NV就是這樣做 GeForce系列RTX或GTX15
[情報] NV Ada 傳聞搭配2.2G有384位GDDR6X,5nm根據Greymon55的最新傳聞NVIDIA的Ada Lovelace AD102 GPU的時脈速度可能高達2.2 GHz 。 已經有不少關於NVIDIA Ada Lovelace GPU的傳言 尤其是AD102 SKU。AD102 GPU將為遊戲玩家或工作站用戶的旗艦顯示卡系列提供動力 它將是現有GA102 GPU的繼任者,因此我們絕對可以期待一些殺手級的規格。7
[情報] NV暗示會在GTC2022間發布Hopper GPU架構Hopper顯示架構很可能會在下週的NVIDIA CEO主題演講中公佈 這是人們期待已久且傳聞不斷的專用於數據中心和高性能計算的產品系列。 NVIDIA Hopper被認為是該公司的第一個多晶片模組設計,擁有兩個小晶片 此外據傳它是NVIDIA有史以來製造的最大顯示處理器之一,單個晶片尺寸超過了853 mm2
1X
[請益] 請問,這三組線都要接嗎?6
[請益] 低噪音電源供應器選購(SFX佳)5
[開箱] 金士頓FURY Beast DDR5-6000 CL30白化版6
[菜單] 70K內3A遊戲主機3
[菜單] 30K FPS遊戲機2
[菜單] 50K 舊機升級2
[菜單] 40K-50K遊戲機請益1
[菜單] 50K-60K遊戲機菜單請教4
[菜單] 55k菜單請益1
[菜單] 25K M-ATX 遊戲機1
[菜單] 30K內 暫定文書機1
[菜單] 20K文書機1
[菜單] 40-45k 剪輯 + 3D + Ai為主,遊戲為輔1
[菜單] 40K內 FF14白色主機1
[菜單] 45K 影音輕度遊戲機(白色/M-ATX)