Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?
※ 引述《luvstarrysky ()》之銘言:
: 心得:黏膠水的架構似乎生出了快取延遲的問題,這點在Ryzen CPU靠堆疊3D快取的方式: 來解決,但AMD為了賺錢是絕對不會在Radeon GPU上複製這種方式的,畢竟現在都: 只能靠吃NV吃剩的大餅碎屑來充飢,不需要搞得多好也有粉絲買單,財報好看,: AMD笑哈哈,消費者苦哈哈。
這樣的心得真的只是來挑釁的。引述的url也內容空洞。來看最原始的文章吧
先講L3的latency並不是很重要,GPU的設計本來就是吃bandwidth犧牲latency。
L3在chiplet,latency增加並不是大問題,大問題是data從mcd到gcd需要很大的能耗,所以這是Navi31異常耗能的原因之一。L3真的不應該在chiplet上,N/I擴張L2棄L3是有原因的。
https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/
這篇其實主要是講VOPD(dual issues)的問題,rdna3在wave32本來就不容易dual issues,舊的wave64模式反而容易dual issues,這是compiler的問題。
rx7600還有另一個大問題,因為用6n而不是5n空間不夠,犧牲掉vector registers,這造成dual issues更困難,因為vector registers的不足。
本來rdna的設計就是wave32雖然效能比wave64差但比較容易達到好性能,但現在VOPD的情況下就反過來了。令人感嘆wave32真是白忙一場的設計。
https://i.imgur.com/wsGh4b3.png
這篇其實蠻有趣的,如果你想粗淺了解rdna3的架構與問題。
-------------------------------------
如果你想黑A,找一下geohot最近兩天的言論,真是把AMD黑死了,雖然geohot自己的問題也很大,但他黑之有物
--
rdna3真的是大大大失敗
所以蘇媽該降價了
黑A真的要言之有物 相比前篇心得跟坨一樣
the tiny corp 才沒多久 他又轉向了..XD
他只是想黑,才不管內容怎樣
MCM第一代問題多,等下一代
這篇程度和原PO天差地遠
MCD能耗是都花在傳輸上嗎? 這代都2.5D
了 感覺是L3太大本來就吃電 應該不是
傳輸的問題
AMD架構本來就贏不過NV也是問題 天生就
吃電了 MCM的確還有在傷一點 最後就QQ
架構還好,看了geohot黑的點應該驅動
只不過最近我們也是在嘲諷nv功耗換效能?
L3的頻寬用mcm,耗電量大增,SPR也有同樣
問題。驅動就是硬體的延伸,好硬體好驅動
先推再說,雖然我真的看不懂
傳輸耗能沒那麼多拉 功耗差的量級不是
傳輸的問題
2.5D的傳輸功耗應該是1pJ/bit以內
inifite fanout link峰值頻寬是5.3TB/s
全頻寬吃下去40~50W吧 不過怎麼可能沒事
一直保持那麼大的數據交換 多少有影響但
應該不是主因
這邊提到CoWoS 0.5pJ/bit而已 InFO到底
多少還要查一下
https://tinyurl.com/4v2snb2x InFO參考
這邊 可能才0.2~0.3pJ/Bit而已 傳輸功耗
有可能才20W不到 問題不該是這個
比較好奇高速io在不傳輸時是不是很省電?XD
spr的問題不在於emib,而是電壓過
高加上全吞吐avx512和amx
CML-S之後的任何一代電壓都是比正
常需求多出0.1v起跳,SPR都快比電
壓表標的多了0.15v了
server就是穩定性和安全性最重要,SPR
已經延遲了一年,為了盡快出貨,電壓
也只能設定的高一些
EMR會改善的
高頻高效能的die2die功耗那有辦法這麼低
只跑低頻什麼低功率都有可能。spr的問題真
在emib。高功耗i皇還可以解決,emib的效率
還需要時間
講太深…
你太認真了,但是有料給推
54
Re: [討論] Google Tensor X1大核能耗比出爐QQ昨晚 AnandTech 也發了測試報告 Tensor X1 的主要缺點在 memory latency 比 888 的 X1 差 而因為較大的 L2,某些測試上佔有優勢 因此可能是設計上的取捨31
[情報] 4090接招!AMD RDNA3大核心GPU玉照搶先看按計劃AMD將於時間11月4日早上4點 召開RDNA3新品發布會,預計推出RX 7000系列顯示卡。 趕在這之前,疑似Navi 31大核心的RDNA3架構GPU玉照搶先曝光 圖中可以看到中間是一顆大的GCD單元,周圍環繞6顆小的MCD單元 外界預計晶片面積533mm 2,封裝面積55 x 47.5 mm (2612 mm 2 )。20
[情報] 謠言稱AMD在RX7900使用不完整RDNA3 A0版AMD最近推出了採用Navi 31 GPU的旗艦RDNA3產品 即Radeon RX 7900系列。雖然AMD將Navi 31與NVIDIA的RTX 4080進行了對比 但最終的表現略顯平庸,並沒有達到所有人預期的巨大破壞 現在有傳言稱如此低迷的性能背後的原因可能是旗艦卡使用上不完整的GPU晶片。 正如Kepler_L2所發現的那樣22
[情報] 測試表明5700就是5700G砍內顯日前我們看過蘇媽預計在4月發表包括5700在內的共10款處理器 我們本來期許5700會是5700x再砍一刀之類的 很可惜根據情報 蘇媽重溫混淆舊夢 本來5700G已經夠混淆了 現在5700又要混淆一次 是570 0G砍一刀而不是5700x砍一刀22
[情報] AMD Navi 3X RDNA3 GPU 渲染中突出顯示AMD Navi 33 可能比某些人預期的要大 在Wild_C的Twitter上 可以找到Navi 3X GPU系列的精美渲染圖。 這些渲染不僅採用AMD確認Navi 31的六個MCD等最新訊息 而且還設計為在相同的規模內13
[情報] AMD 新影片說明使用 3D V-Cache 技術的 ZAMD 新影片說明使用 3D V-Cache 技術的 Zen 3+ 架構 sinchen sinchen · 2021-06-11 AMD 藉由 YouTube 影片來說明新的 3D V-Cache 技術與即將到來的 Zen 3+ 處理器。 AMD 在 COMPUTEX 2021 發表 3D V-Cache 技術採用 TSMC SoIC stacking 堆疊技術,讓 晶片可往 Z 軸堆疊而非只能增加 X 軸的面積。而當時展示的是 Ryzen 9 5900X10
Re: [情報] AMD與TSMC合作的3D Chiplet分析後來這篇文章在稍早有補一些更進一步的內容 渣翻一下 1. 這個技術將會在Zen 3架構的Ryzen處理器上產品化,但EPYC是否會採用就沒說 2. 採用新技術的處理器會在今年年底開始生產,但沒說何時發售,照AMD的步調應該會是8
Re: [情報] AMD和微軟解決了Ryzen在Win11效能問題我想問一下 有人跟我一樣 實際安裝新的晶片驅動+更新windows後 成績還是比win10還差的嗎?6
[情報] AMD新專利:為GPU導入擁有多路快取的主AMD新專利:為GPU導入擁有多路快取的主動式橋接小晶片 Ted_chuang Ted_chuang · 2021-04-06 近日曝光的一項新專利表明,在CPU領域成功運用小晶片設計之後,AMD還有望在即將到來 的RDNA 3 GPU架構上落實同樣的設計理念。Videocardz指出專利中描繪了整合有快取主動 式橋接小晶片,適用於有多個小晶片的設計,能夠在多個GPU核心之間架起溝通達到橋樑