[情報]Zen 5微架構解密,提升執行單元數量與寬度
來源
https://benchlife.info/amd-zen-5-microarchiteture-preview/
Intel 消費性平台消失的 AVX-512,以全速之姿在 AMD Zen 5 微架構當中復活了!
在正式進入 Zen 5 微架構之前,我們希望先行提到製程的二三事。
此次 Zen 5 微架構的推出,在製程方面搭配 TSMC N4(桌上型處理器版本)∕ N3(行動處理器版本);特別是桌上型處理器版本,製程演進並不若 Zen(GF 14nm)> Zen 2(
TSMC N7)或是 Zen 3(TSMC N7)> Zen 4(TSMC N5),N4 算是 N5 的強化版本,在
TSMC 的規劃中並非完整的製程世代躍進。有了這個先決條件之後,讀者可以思考一下
AMD 是如何去強調 Zen 5 和 Zen 4 之間的差異。
執行單元變多、變寬
相較於先前多個 Zen 微架構的世代演進,AMD 這次在 Zen 5 微架構的著墨上少了許多至少 PPT 就少了好多頁,最主要的變化集中在執行單元的數量以及寬度。就 AMD 內部統計而言,執行單元以及 retire 指令數量的成長替 Zen 5 IPC 貢獻最多效能提升幅度,資料路徑強化 ∕ 解碼和微指令快取次之,原本在 Zen 4 IPC 提升幅度最大的前端部分反
而沒有提及。
▼ Zen 5 微架構讓效能提升的因素,最主要集中於執行單元數量和寬度提升。
https://benchlife.info/wp-content/uploads/2024/07/001-1000x563.jpg
讓我們同樣從處理器核心的前端出發:分支預測更為精準、輸出量提升、延遲更低已是每一代微架構的必修學分,L1 指令快取也同樣改善了頻寬和延遲(每時脈週期 32Byte 升級至 32Byte x 2)。比較重大的變化發生在解碼單元,直接從 Zen 4 的單一解碼單元每時脈週期輸出 4 個指令,直接翻倍來到 Zen 5 的 2 個解碼單元每時脈週期共輸出 8 個指令,微指令快取從每時脈週期輸出 9 個變成 6 x 2 個,微指令佇列配發數量也從每時脈週期 6 個提升至 8 個。
▼ Zen 5 微架構前端較大的變化位於解碼單元,從前一世代的 4 個指令翻倍為 8 個。
https://benchlife.info/wp-content/uploads/2024/07/002-1000x562.jpg
整數單元部分,ALU 從 4 個提升至 6 個、乘法單元變成 3 個、AGU 和分支單元分別多 1 個,並且更平均地安排每個執行單元。隨著執行單元數量的提升,dispatch ∕
retire 指令數量最高也來到 8 個。從簡報的圖示看來,Zen 5 排程器的規劃方式也有所不同,Zen 4 採用 2 個執行單元埠共用 1 個排程器的設計,Zen 5 則是改為含 ALU
功能的埠共用 1 個排程器、AGU 則共用另外 1 個,但 AMD 並未說明排程指令數量的變化。
▼ Zen 5 微架構整數部分新增多個執行單元,dispatch ∕ retire 同步提升至 8 個指
令。
https://benchlife.info/wp-content/uploads/2024/07/003-1000x562.jpg
浮點數單元數量在 Zen 5 微架構並未升級,同樣有著 6 個(含 2 個浮點加法器、延遲從 3 個週期縮減至 2 個週期),主要因應 AVX-512 指令集進行調整。Zen 4 雖然也支援 AVX-512,卻是透過「double-pumped」的方式,讓寬度僅有 256bit 的浮點單元去執行 512bit 浮點 ∕ 向量運算,如今 Zen 5 已將浮點單元擴充至完整 512bit,代表執行 AVX-512 指令時相較前一世代更快。在 AMD 內部的 IPC 效能測試之中,成長幅度最高的部分也來自於執行 AVX-512 指令。
▼ Zen 5 微架構已將浮點數執行單元部分擴展至完整 512bit,執行 AVX-512 指令相較
Zen 4 微架構更為快速。排程器也升級至 3 個,每個包含 32 個條目,暫存器也因應
AVX-512 而加寬至 512bit ∕ 384 個條目。
https://benchlife.info/wp-content/uploads/2024/07/004-1000x562.jpg
因應執行單元數量擴增、浮點數單元寬度提升,餵資料的速度也必須加快。Zen 5 L1 資料快取從前一世代 32KB ∕ 8-way,升級至 48KB ∕ 12-way,單一時脈週期最高也從載
入 3 筆 ∕ 儲存 2 筆升級為載入 4 筆 ∕ 儲存 2 筆資料(AMD 未說明 512bit 資料長
度時的變化)。其餘 L2、L3 沒有變化,依舊是 1MB ∕ 16-way、32MB ∕ 16-way(
victim 設計,L3 快取實際容量會跟隨核心數量、產品定位而變動)。
題外話,由於 AMD Ryzen 9000 系列桌上型處理器依舊採用與 Ryzen 7000 系列桌上型處理器相同的 cIOD,因此每個 CCD 向 cIOD 的讀寫頻寬應該也相同;每個 Infinity
Fabric 時脈週期,CCD 向 cIOD 傳輸 16Byte 資料、cIOD 向 CCD 傳輸 32Byte 資料。(根據 AMD 簡報尾部的附註小字,Ryzen 9000 搭配 DDR5 記憶體的較佳運作速度應該仍是 DDR5-6000)
▼ Zen 5 L1 資料快取升級至 48KB ∕ 12-way,也同步提升讀寫頻寬。
https://benchlife.info/wp-content/uploads/2024/07/005-1000x562.jpg
AVX-512 完整效能加持
最後就是 IPC 比比看的時間,根據 AMD 的測試,Zen 5 相較 Zen 4 的 IPC 幾何平均提升幅度來到 16%,特別是那些使用到 AVX-512 指令的應用程式幅度最高,機器學習效能可提升 32%、Geekbench 5.4 的 AES-XTS 更高達 34%!
▼ 相較於 Zen 4,Zen 5 IPC 幾何平均提升幅度達 16%。
https://benchlife.info/wp-content/uploads/2024/07/006-1000x562.jpg
▼ 應用到 AVX-512 的指令,Zen 5 IPC 提升幅度更高!
https://benchlife.info/wp-content/uploads/2024/07/007-1000x562.jpg
但影音處理,AI,渲染RYZEN 9900X應該就默秒全,
之前曾經看過7950X的某項AVX512測試結果很驚人
https://tinyurl.com/exubbs6n
https://images.anandtech.com/graphs/graph17585/130235.png
期待之後的完整測試
--
聽起來就像tick tock
雖然看不懂不過這篇很佛心都用中譯詞
這個3D particle movement測試可以反映在
哪些應用上
wow,avx這麼兇殘
希望有16c32t的x3d出來
7950X3d 不就是16c 32t嗎
結果還是塞完整的512bit電路了
i粉會認為avx512已經是過時設計嗎?Y
I皇不用 就等於過時了 懂?
Intel也沒有不用 只是在消費級平台上放
棄而已
到時候來看看有沒有人評測A版的AVX512的功
耗 I版的AVX512功耗 I皇一直駕馭不了 嗎?
epyc敢塞192c時脈還這麼高能耗應該不差
真不知道怎麼弄的
9xxx的X3D先生出來再出來談吧,我是認為
快點把Jim找回去設計新CPU才是正經
等9000X3D
我記得舊的12代有些可以用AVX512吧
把Jim找回來幹嘛? 也要人家想回來
現在intel根本就不是對手
重返榮耀
PPT不管吹多好,都要等跑分出來再說
竟然有avx512 太扯
intel這次要被壓在地上摩擦了
看用途, 有用到512就吊打對手, 沒用到就
無感
zen4就有avx512了只是他是跑兩次
256bit電路達成,zen5給了一套完整的電路
intel當時avx512被詬病的是會鎖頻降頻
一張板子需要多少錢買的到@@
如果不會影響別的東西的效能 avx512 放那邊
不會有人抱怨的,雞肋指令集那麼多沒啥人譙啊
牙膏當初最大的問題是小核沒AVX512阿
因為小核沒有 結果搞到只能關小核才能
用
現在最便宜的板子也要3千
板子你買B650不也行
Kim早就在別的地方玩的正樂,根本不會想
回來
Jim*
Kim在平壤也玩得很樂
我都直接稱呼jk啦
jk聽起來好像很糟糕(X
這篇有誤,行動處理器一樣是N4 只有EPYC
用上N3
面積竟然差不多
現在AMD跟intel的PPT都很會吹噓的
的確要等之後實測再說
等9月架構日以後再說吧,不只架構隔
壁現在超多東西都是新的,這種場面
打起來才好看
870itx不要再給我違建了......
RPCS3 爽跑
超寬設計通常伴隨高耗能,不過靠製
程又能降低能耗。可以說隨製程進步
架構也能隨之進步吧
512跑模擬器有用 但製程問題有高耗能毛病
期待9000的x3D
Strix Point 的被閹
反正未來是 ARM 時代了,AMD = 卒業
講的好像and不能轉行一樣。 intel都想用at
om去戰arm
曾經啦。 現在不知道
說ARM時代的去看看Snapdragon X
我現在就有X plus的機器,能耗比很滿意,
但我不認為這程度能把X86幹趴
intel跟AMD都不是死人啦,X86再戰30年我
都不覺得是問題
笑死人 以為x86原地踏步哦
而且續行有個邊際效應 10小時以上就沒什
麼好挑的了 那種15小和20小的 根本就都
用不到沒電
自從apple m1出來之後一直有人在吹arm
x86已死或將死,不知道吹多少遍了
如果arm只有能耗比能拿出來,那還是算了
對user而言,軟體相容性>能耗比
省電但是不能跑我想跑的軟體,就是塊漂亮
的磚
能耗比差距夠大是真的能讓軟體開發商跟
使用者轉向就是了,但X86是真的追上來了
,沒有原地踏步,ARM的優勢在慢慢的消失
就算是intel 高通要在CPU贏過還有得拚
Intel AVX512是10nm的,AMD Zen5是4nm
能耗贏過不意外吧
測試15小可能遊戲4~5小而已
x86有進步,開倒車的是windows....
一堆反智的ui設計...
amd轉投台積電後能耗比也沒讓人不滿意吧
,況且他一直很穩定的在提升核心推進製程
。
ARM沒某些人吹的那麼神
那個也不是少數 有一派就堅信X86末日已到(
還不是將至) 說DC轉ARM的越來越多了 PC也輸
移動裝置的續航更是被屌虐 全面崩盤 看的我
心驚驚 想要換9900X惹 是我走錯世界線嗎
arm能面對明年的GTA6嗎?
沒前途了500收
你GTA6上市也沒PC可以玩啊
首發只有主機版
阿痛戰ARM 牙膏哪有放棄 現在不就小核
只是名子換一下 要幹ARM的心一直不變
是的,不要幫i皇放棄好嗎?蘇嬤是真的
放棄了
蘇嬤是打算也要下去玩ARM,搞雙棲,i
皇在努力弄X86s,X86陣營不會輸的,CI
SC才是王道
GTA6能不能在ARM上面跑你該去問的是
蘋果,你看每年WWDC就知道,他們是
真的有在找遊戲商談
蘇媽什麼時候開始打算要玩ARM?
又,蘇媽放棄什麼?
你講的是事實還是從你的「妄想心」講出
來的?
atom的繼承人N100玩的還可以
n100只是初步啊 新一代的小核可是比這代
大核還猛 待機功耗也好很多 xeon 6的表
現反映出來 下一代應該很有搞頭
xeon那邊似乎有整顆只有一堆ADL小核的東西
很明顯是要跟ARM伺服器拚一把
AMD玩ARM應該是農企時期的K12計畫 那東西
笑死人說x86遊戲續航的 怎不看看自己Arm
遊戲續航好到哪去?
最後也沒下文了
阿不過Arm真的暫時不用擔心遊戲續航啦
先能跑遊戲才是真的
現代cpu的內部架構不都是類risc的,外層都
有解碼器負責翻譯,轉譯cisc指令的x86當然
比risc的arm需要更高代價,x86的存在理由
也只有相容性而已
ARM跑遊戲我覺得大問題反而在GPU
X系列一堆遊戲開不起來或效能很差根本就
GPU驅動問題
相容性問題可不只是而已
實際用過就懂了啦!更何況X86現在跟ARM的
差距可沒有當年M1剛出來的時候那麼大
I皇不行了,改叫I兒吧
感覺比較像對料,沒有改架構
所以應該算是Zen4 +吧,吹AVX-512效能
感覺..
堆料是講I吧?Y
架構的確沒有大改,就Zen4升級版的感覺
改架構就是堆料阿 不然還有什麼改法
高通GPU從DX11開始支援,DX10以前不知
道有沒有做出來
Zen5這次架構的確沒大改
大改會像Zen2->Zen3那樣 CCX配置、調度都改
這次改進主要是增加執行單元數量、寬度
樓上所言極是,這回Zen5給我的感覺就是
只在AVX512有下功夫這樣
當然執行單元數量、寬度也是有下功夫
先講只有然後當然其他也有,好亂啊XD
因為忘記看到執行單元那些東西了Orz
唉~似乎過了一定年紀就容易忘東忘西的
從之前Ryzen AI 9 365的這一篇偷跑詳測
就可以看出不少Zen5架構的設計方向
雖然他測試的是APU的Strix Point核心
但可看出就是在Zen4現有的架構上去強化
AVX10.2不知啥時才會在消費端看到
60
[情報] AMD即將推出的Zen 5 CPU核心 效能可能比ZAMD 即將推出的 Zen 5 CPU 核心,效能可能比 Zen 4 核心快 40% 一場桌上型處理器大戰即將在今年底到來,但我們對超微(AMD)、英特爾(Intel)下一代處理器效能規格與效能仍知之甚少。據國外消息人士 Kepler_L2 透露,AMD 預計下半年發布的全新 Zen 5 CPU 微架構,核心效能將比 Zen 4 快 40% 以上。 AMD Zen 5 CPU 架構採用台積電 3 奈米製程,目前各界對 Zen 5 CPU 細節還不太清楚,但預計會提高性能效率、內建人工智慧和機器學習最佳化、前端重新管道化,據傳單核心效能提升 15%,多核心效能提升 30%,準備在今年下半年進攻桌上型電腦、筆記型電腦、伺服器等領域。 而據知名洩密者 Kepler_L2 最新發布文章,Zen 5 核心效能很可能比 Ryzen 7000 處理器(如 Ryzen 9 7950X)中使用的 Zen 4 核心快 40%。56
[情報] 傳 AMD Zen3+加強版11月量產遊戲提升15%AMD 5nm Zen4 處理器最快要到 2022 年才有機會跟大家見面,面對 Intel 全新 12 代 Core 系列來勢洶洶 AMD 也準備推出 Zen 3+ 加強版處理器來應對,升級使用 3D V-Cache 的 Zen 3+ 加強版 預計遊戲性能可提升 15% 有新消息指出,AMD Zen 3+ 加強版將會在 11 月開始量產,並計劃在明年 1 月份舉行的41
[情報] Ryzen 4000領銜 AMD今年祭出最強Zen 3Ryzen 4000領銜 AMD今年祭出最強Zen 3天團 IPC提升多達15% 除了桌上型的7nm Ryzen APU,AMD的7nm Zen 2家族經過一年 的布局已經差不多完成了。今年的重點將轉向新一代處理器, 亦即7nm+製程的Zen 3,且此次是Ryzen 4000桌上型、Ryzen Threadripper 4000及EPYC三大系列全面出擊。30
[情報] Steam調查:AMD處理器使用率持續攀升 不Steam調查:AMD處理器使用率持續攀升 不斷蠶食友商市佔 Steam公布2月調查報告,其中數據顯示,AMD持續蠶食Intel處理器市佔。 近年以來,AMD一直在蠶食Intel於處理器市場上曾經的主導地位,此一趨勢於去年第四季發生了變化,Intel市佔逆轉成長,此主要是因為AMD的處理器缺貨。 前述情況於去年12月的Steam調查中亦得到驗證,當時AMD出現了近年來的首次下滑。但於那之後又恢復了”正常”,AMD處理器佔比2月上升0.52%,現在來到了28.51%。28
[情報] IPC大漲52% AMD員工解密Zen架構內幕IPC大漲52% AMD員工解密Zen架構內幕 此人功不可沒 AMD近幾年股價大漲,市值已超過1700億美元,與Intel沒差多少了,復興的最大功臣當屬Zen處理器了。2017年3月發表了第一代,現在發展至7nm Zen3,明年就要推5nm Zen4了。 於AMD Zen架構上,AMD帶來了全新的設計,其中IPC效能大漲52%,超過了原定的40%提升,雖然這些都是相對於推土機架構而言的,但效能提升幅度之大亦確實前所未有。 Zen架構的功勞是無與倫比的,此件事上還引發了誰是Zen之父的爭議,之前大家把CPU大人物Jim Keller視為Zen之父,後來AMD架構師Mike Clark表示自己才是真正的Zen之父。22
[情報] Ryzen 9 5900X曝光:依然12核心、架構天翻地覆Ryzen 9 5900X曝光:依然12核心、架構天翻地覆 Ted_chuang Ted_chuang · 2020-09-17 AMD已經官方宣布將在10月8日正式發布採用Zen 3新架構的下一代Ryzen桌上型處理器,但 時至今日仍然缺乏確切的架構細節、產品規格。 軟體工程師Patrick Shur曝料稱,他找到了兩顆新Ryzen,一是Ryzen 9 5900X,12核心,19
[情報] AMD Zen 4 架構 Ryzen 7000 處理器曝光,AMD Zen 4 架構 Ryzen 7000 處理器曝光,將採台積電 5 奈米製程打造 作者 Atkinson | 發布日期 2021 年 02 月 23 日 17:20 在當前,市場上許多玩家仍在搶購 AMD Ryzen 5000 系列桌上型處理器,或是觀察行動平 台中剛推出的 AMD Zen 3 架構處理器之際,外媒已經開始爆料指出,採用 Zen 4 架構的 Ryzen 7000 系列處理器已經在進行開發。其中,桌上型平台的代號是「Raphael」,而20
[情報] 6nm、代號 Warhol傳聞 Zen 3+今年底上市傳聞 AMD 還留有一手,上週 Twitter 爆料大神們表示, AMD Zen 4 處理器受 5nm 產品 緊張將略為延後,而 Zen 3 與 Zen 4 處理器之間將會推出半代更新的 Zen 3+ 處理器, 預計 2021 年底上市,雖然 IPC 性能提升幅度不大,AM4 主機板最後支援的 CPU 型號。 據了解,AMD Zen 4 將會變化非常大的微架構產品,包括了 5nm 制程、AM5 接口、更先 進的 Chiplet 設計等等,但面對 5nm 產品緊張亦導致 Zen 4 上市時間略為延後。16
[情報] AMD的下一代Ryzen Threadripper 5000AMD的下一代Ryzen Threadripper 5000 ‘Chagall’ HEDT處理器預計將於八月份發布 HWiNFO已添加對AMD下一代Ryzen Threadripper 5000 HEDT桌上型處理器的初步支援。最 新的軟體版本增加了對採用AMD Zen 2的Threadripper PRO以及下一代採用Zen 3的Ryzen Threadripper 5000處理器的支援,傳聞將於2021年第三季發布。
62
[心得] [反推] 華碩全部的X870/X870E主板11
[請益] 玩rimworld 哪顆cpu比較適合15
Re: [閒聊] 9800X3D無限伍壓的住嗎4
[菜單] 70~90K 雙螢幕遊戲機健檢3
[菜單] 12K中度遊戲機2
[開箱] DEEPCOOL MYSTIQUE 360 ARGB