[閒聊] 關於30系列的cuda core?
補充:
國外也有些文章在討論,大致上有些脈絡了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可執行一個 Float 64或一個 Float 32
Ampere架構的Float 64 Shaders, 可執行一個 Float 64或"兩"個 Float 32
Tweakers.net也有分析這個架構:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
從圖片來看就很清楚,FP32被劃成兩份,所以說類似超線程的說法其實也蠻正確的
先說不是來打臉或看衰的,只是剛好看到不同見解的說法,分享參考。
逛了一下對岸nga,有些文章提到:
1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
2.這次列出3090有一萬個,3080有8000+個
其實是不是有點類似於超線程的意思?
每個物理core有兩個fp32計算單元
所以算力大約提升兩倍?
實際上die里真正的物理核心只有/2這麽多?
是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
寫的性能。
以上,
分享一下不同的看法,
我也不是對這塊專業領域的,如果最後有錯請勿見怪。
--
不會被吉嗎 這樣標?
20系列表演當場去世
不是說有實測影片?那到底是?
測試參考就好 一定會多很多效能 但實際體驗起來效果
是不是會到2倍 就要看每個人感受了
這要等NV公佈這代詳細的技術文件 才能去推算
不過其實近幾代 NV每代的CUDA結構都有調整變化
可以回去看Fermi->Kepler這代 每SM從32個CUDA大幅
提升到每SM 192個CUDA 然後Maxwell又降為每SM 128個
呵呵對岸論壇,一堆奸商還在垂死掙扎
當時Maxwell的技術文件有提到 Maxwell的每SM能達到
前代Kepler每SM 192個CUDA的9成效能
所以我覺得 這代CUDA結構應有重新調整 可能部份精簡
但藉由12nm到8nm製程的電晶體密度提昇 可以塞入更多
反正fps test出來就一翻兩瞪眼
不過GPU從以前繪圖管線年代到現在GPGPU年代
沒看過廠商是標等效數量的 都是標實際管線數量
遊戲實測都出來了 也沒啥好夢的 20系列已死去
樓上可以開示一下,現在哪裡有遊戲的實測數據的?
YT:Digital Foundry
對岸有一個我常在看的影片製作者 說沒開光追3070跟
2080TI差不多 那開光追和dlss就......
就說對岸論壇一堆奸商了吼
就算不開光追差不多,3070價格也便宜很多不是嗎
都大贏70%以上了 消庫存無良廠商還想騙嗎
而且講的2080ti以前像便宜貨 大家都用過的樣子 0.0
實測都有了
廣告不實在各國都會很慘,老黃不會蠢成這樣
不關他的事啊 AIC 要堆價格 你無招啊
怎都沒有半個公信力的遊戲實測出來?應該早拿到了吧
還沒解禁吧,測試文流出會被告的
說真的第一句話就滿臉問號了GM/GP/TU的FP64處理核心
比FP32處理核心少很多...
26
[情報] NV Ampere 普及RTX光追RTX3080/Ti獨享SLI對於NVIDIA下一代的Ampere GPU,昨晚的最新爆料給出的說法跟之前不同,顯示遊戲用的 Ampere顯示卡使用的是三星10nm製程,CUDA核心也沒有之前那麼誇張,但RTX 3080 Ti性 能大概會提升40%,增幅不算低了。 這份爆料出自網友CorgiKitty,從昨天到現在他還給出了更多的訊息,再來補充一下。 1、之前他爆料Ampere GPU的FP32規模會翻倍,但不代表CUDA核心數會大漲,因為NVIDIA19
[情報] 關於NV Ampere GPU 晶片尺寸,規格,架構關於NVIDIA即將推出的Ampere GPU一直是他們大肆宣傳和期待的主題。據了解NVIDIA的旗 艦GPU將擁有826mm2 的巨大Die 儘管未提及製程,但如此大的Die確實會稍微增加它使用較舊,更成熟的製程(如12NFF) 的可能性 根據台積電7nm的成熟程度,對於數量有限的限量生產,826mm2 的大晶片也不是完全不可18
[心得] 美股個股空頭歷史資料整理網站blog完整文章: 一般像Yahoo財經, Finviz等投資網站都有個股的空頭資訊(Short Float, Short Ratio), 可是卻沒有提供這些指標的歷史變化, 所以看不出來目前該公司的空頭比例是正 在增加還是減少, 也不知道變化有多劇烈, 就決定寫個網頁來整理這塊資訊。16
[情報] RTX30 系列社群Q&A官方對社群的Q&A 簡單翻幾個有趣的 Q:為何3080只給10GB,這數字是如何決定的,這個數字與前代相比沒有進步 我們持續分析最新的遊戲、以及定期了解開發者接下來新遊戲的記憶體需求 3080的目標是在最低的價格上給你好的 4K+全開+高解析材質包 的效能9
[情報] rx7800 7600顯示卡規格根據傳聞,AMD下一代顯示卡還會有至少兩個核心,一個是高階的Navi 32,預計對應RX 7 800系列,另一個是主流的Navi 33,預計對應RX 7600系列。 AMD ROCm程式碼庫中意外洩密,披露了它倆的核心規格,分別有60個、32個運算單元,相 當於Navi 31的三分之二不到,以及整整三分之一。15
[情報] NV Ada 傳聞搭配2.2G有384位GDDR6X,5nm根據Greymon55的最新傳聞NVIDIA的Ada Lovelace AD102 GPU的時脈速度可能高達2.2 GHz 。 已經有不少關於NVIDIA Ada Lovelace GPU的傳言 尤其是AD102 SKU。AD102 GPU將為遊戲玩家或工作站用戶的旗艦顯示卡系列提供動力 它將是現有GA102 GPU的繼任者,因此我們絕對可以期待一些殺手級的規格。12
[情報] Quadro初階繪圖卡新產品T400/T600/T1000NVIDIA的專業Quadro繪圖卡系列 中高階產品已經更新為 Ampere架構的A4000、A5000、A6000 初階等級的產品P400、P620、P1000 也終於從Pascal架構更新為Turing架構X
[情報] Intel曝光32核IceLakeSP擊敗64核AMD EPYCIntel已經發布了其下一代Ice Lake-SP Xeon Platinum 處理器的新性能數字 並將其與AMD的第二代EPYC Rome處理器進行了比較 Intel表示擁有更新核心架構的Ice Lake Xeon處理器將比上一代Cascade Lake Xeon處理 器提供18%的IPC提升 從而使其擁有與AMD高核數CPU產品競爭的能力。8
Re: [閒聊] 王國之淚去年延期時已接近完成對不會改變大少,伸縮的物件而言 一般用 2 個 vector3 就好了, 6 個float浮點數, 6x4=24byte struct vector3 { float x, y, z;