PTT評價

Re: [閒聊] AMD你也有大小核出問題的一天啊

看板PC_Shopping標題Re: [閒聊] AMD你也有大小核出問題的一天啊作者
tint
(璇月)
時間推噓25 推:25 噓:0 →:84

※ 引述《mayolane (沒有人啦)》之銘言:
: Ryzen AI 9 HX 370有Zen5*4+Zen5c*8
: 主要的問題是Zen5和Zen5c在兩顆CCD上
: 彼此用Infinity Fabric連接
: https://i.imgur.com/acR8B42.jpeg

: 然後彼此之間通信延遲鋼彈180 ns
: 要知道7950X兩顆CCD的延遲也才79 ns

在前代Zen4架構
消費級首次用上Zen4+Zen4c大小核的
Phoenix 2 APU(7545U/7440U、Z1、8500G等使用)
Zen4+Zen4c大小核是位於同一個CCX上
https://i.imgur.com/8PqjH3e.jpeg
6個核心共用16MB的L3快取
雖然大核Zen4對比桌面版L3快取縮小
但整個CCX共用16MB的L3
4個Zen4c每核平均也能分配到2.6MB的L3

以桌面的8500G為例
Zen4c小核的最高時脈為3.7GHz
參考一些評測,跨小核的延遲並未明顯增加
Phoenix 2 APU的Zen4c
在應用上就是時脈較低的核心

這次的Zen5 Strix Point APU
配置4個Zen5+8個Zen5c大小核,總共12核心
其中4個Zen5大核心
給到和桌面一樣完整的L3(每核平均4MB)
但8個Zen5c小核,則精簡到僅8MB L3
每核心平均只有1MB L3

依之前AMD公佈的投影片說明
https://i.imgur.com/8b3nqmH.jpeg

這次4個Zen5和8個Zen5c
分別為二組獨立的CCX
4個Zen5的CCX共用16MB的L3
8個Zen5c的CCX則只共用8MB的L3
二組CCX彼此使用Infinity Fabric相連
有點類似以前Zen2時的設計

Strix Point APU這樣的雙CCX配置
導致跨二組CCX上核心存取時
會受限於Infinity Fabric的頻寬
跨CCX的延遲和頻寬可能會受不小影響
而且Zen5c的CCX僅有8MB L3快取
大小核效能的落差可能更凸顯出來

在6月時一篇Ryzen AI 9 365偷跑詳細測試中
就能看出這次雙CCX設計的特徵
https://blog.hjc.im/zen5-preliminary-review.html
Ryzen AI 9 365這顆APU為Strix Point核心
遮蔽2個Zen5c小核
為4個Zen5+6個Zen5c總共10核心的配置
文章中跨二組CCX的同步測試
https://i.imgur.com/zIrijeT.jpeg

可觀察到跨到CCX時的延遲和頻寬
都有明顯受影響的情形
延遲增加至170ns
頻寬從28000MB/s左右降至9000MB/s等級

Strix Point這次的雙CCX設計
在跨CCX的應用上
可能也抵銷了一些這次給到4個滿規
Zen5核心的性能優勢
不過Strix Point的能效表現仍是不錯的
Strix Point雙CCX的架構
AMD在設計初應就知會有這情形
但Strix Point主要面向移動端產品
配置12核心和16CU RDNA3.5內顯
各方面都已有不少提升了

明年還會有一顆面向主流市場
原生8核心Zen5 APU「Kraken Point」推出
配置4個Zen5+4個Zen5c的大小核設計
內顯是8CU規模,NPU維持50TOPS算力
看起來非常適合掌機和低功耗裝置
到時可以觀察看看這一顆APU
大小核會不會回到採用單CCX的設計了
--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.6.173 (臺灣)
PTT 網址
※ 編輯: tint (123.204.6.173 臺灣), 07/31/2024 11:21:06

canandmap 07/31 11:20推解說,所以延遲高的原因看起來似乎

canandmap 07/31 11:21就是L3不夠+IF頻寬不足,導致這樣的結

canandmap 07/31 11:21果發生

smallreader 07/31 11:43IF頻寬高要更耗電所以頻寬給很少嗎

SHR4587 07/31 11:46下一代移動端應該就是改進延遲問題了

SHR4587 07/31 11:47這次就算有延遲問題整體表現還是很亮眼

SHR4587 07/31 11:47遊戲是可惜了,但會買這類型產品的遊戲

SHR4587 07/31 11:47應該都是附加價值吧

avans 07/31 11:48推解說

bunjie 07/31 11:53推詳細解說

Arbin 07/31 12:31遊戲筆電大概還是得要等全大核或是單CCX

oopFoo 07/31 12:39筆電的cpu功耗最重要。現在分成兩個ccx,

oopFoo 07/31 12:40一個是lowish power island,平常就用這個

oopFoo 07/31 12:41高功耗的ccx可以關掉。你串在一起無法關掉

oopFoo 07/31 12:41省電。ringbus很耗電的。上一代的反應不好

oopFoo 07/31 12:42就是功耗降不下來。這個跟MTL的lpe有點像

oopFoo 07/31 12:42但MTL的兩顆ecore太少了。

oopFoo 07/31 12:50以後主流一定是要分流的

smallreader 07/31 13:18AMD好像是Mesh但我資訊很久沒更新了

smallreader 07/31 13:27哦是在說Intel P/E核同在ringbus耗電

higali 07/31 13:47筆電功耗很重要不能像桌面端那樣

pig 07/31 14:02anandtech 有把前一代的 latency 拿來做對照

pig 07/31 14:10延遲變高,但效能還是把前一代壓在地上打啊

SHR4587 07/31 14:15主要是遊戲方面這顆就是夠用就好

SHR4587 07/31 14:15這問題目前看起來就有但不妨礙他是一顆

SHR4587 07/31 14:16很強勁的SOC這樣,下一代能改善是更好

mtc5566 07/31 14:46RingBus和Mesh都是Intel的架構 AMD就是CC

mtc5566 07/31 14:46X和IF架構

smallreader 07/31 14:55看過說Zen3(?) 8C CCX的拓樸為非全連

smallreader 07/31 14:55結的mesh

oopFoo 07/31 15:02https://i.imgur.com/E0NJ9Ot.jpeg

oopFoo 07/31 15:03Zen3最大的改良就是ringbus。

mayolane 07/31 15:04oop又要來懂得都懂了嗎

smallreader 07/31 15:04https://anandtech.com/show/16930

smallreader 07/31 15:04原來是..官方說ring但評測認為非單純

smallreader 07/31 15:04ring

smallreader 07/31 15:04我直接跳成mesh抱歉XD

oopFoo 07/31 15:05你那個ring跟cache的ringbus是不同的東西

smallreader 07/31 15:12哦!ring是A-B-C...接力相連 ringbus

smallreader 07/31 15:12是地鐵站嗎

oppoR20 07/31 15:15最喜歡看兩家粉絲吵架了 兩邊信仰都很純

oopFoo 07/31 15:21所以我不想再講了,不是來鬧場,就是真的

oopFoo 07/31 15:21完全不懂。

smallreader 07/31 15:23https://reurl.cc/XR667e Zen3 ppt

smallreader 07/31 15:23第10頁,所以正解ring bus XD

smallreader 07/31 15:41獻醜了,原來是說AMD L3快取一個環跟

smallreader 07/31 15:41Intel環上還有IMC,QPI,IO等站 不一樣

smallreader 07/31 16:00AMD不會為了cross CCX問題去開發12個

smallreader 07/31 16:00核的CCX,只有Zen3那次革新 4→8核,

smallreader 07/31 16:00要堆核心就用IF連結每個[至多8核]CCX

smallreader 07/31 16:04Phoenix 2 APU那張圖由於是2*Zen4+4*

smallreader 07/31 16:04Zen4c,6個核所以也能容納一個CCX內

smallreader 07/31 16:1516MB可能是拆成大核4MB*2+小核2MB*4

sdbb 07/31 16:25羅技無線裝置省電,且有bolt,鍵鼠共用

sdbb 07/31 16:26抱歉推錯篇

smallreader 07/31 16:29查到Bergamo的Zen4c也是每核有2MB L3

smallreader 07/31 16:29但Zen5c一個CCX可以上到16核各1MB L3

tint 07/31 17:00#1a_TSJ-d (PC_Shopping)

tint 07/31 17:01之前oopFoo網友po的Phoenix2 (Z1)情報

tint 07/31 17:02大小核都在同一個Ring上 共用完整16MB L3

tint 07/31 17:05比如R3 7440U這顆4核心APU 參考AMD官網資料

tint 07/31 17:06只有1個Zen4+3個Zen4c(Phoenix2遮蔽下來的)

tint 07/31 17:06L3也進一步砍成4個核心共用8MB L3快取

smallreader 07/31 17:11看↑推文以前猜Zen5c L2會不會減半,

smallreader 07/31 17:11現在確定維持1MB,是不是其他細節也

smallreader 07/31 17:11跟Zen5一樣,還算是同質核心?

tint 07/31 17:13我也覺得這次Strix Point直接採用雙CCX設計

tint 07/31 17:16可能AMD是為了省事 像之前Zen3 Cezanne APU

smallreader 07/31 17:18^看來L3的slice不是一定要4+2*3=10MB

smallreader 07/31 17:18因為都在ring上共用 延遲週期也一樣

smallreader 07/31 17:18然後遵守2的倍數比較簡單

kenny72014a 07/31 17:20如果省電是動態關CCX就猛了

tint 07/31 17:21可能直接從Zen2 Renoir APU的晶片配置上

tint 07/31 17:23替換成Zen3 CPU架構的CCX配置來延續晶片設計

tint 07/31 17:25因為對比Cezanne APU和Renoir APU的Die shot

tint 07/31 17:25Zen3 Cezanne的Die上有一塊沒功能的區域

tint 07/31 17:26所以AMD省事省設計也不是一二次了

smallreader 07/31 17:27Cezanne從Renoir搬過來 有很多留白處

smallreader 07/31 17:28https://redd.it/p48mop ^來源這篇

tint 07/31 17:29Zen5c更多資訊就看看Kraken Point設計如何了

tint 07/31 17:30畢竟這次Strix Point晶片據說成本不低

tint 07/31 17:30Kraken Point可能是更面向主流市場的晶片

tint 07/31 17:328000G系列下一代桌面版APU 也可能會用Kraken

smallreader 07/31 17:35先猜Kraken Point有2CCX,4個Zen5c的

smallreader 07/31 17:35CCX砍半剩4MB L3

tint 07/31 17:40我覺得Kraken的4個Zen5大核可能仍會精簡L3

tint 07/31 17:41就像過往Zen4、Zen3那樣共用16MB L3的設計

tint 07/31 17:45這樣的設計大小核仍在同一個CCX上機率不低

tint 07/31 17:46Kraken APU設計方向可能成本能省則省

smallreader 07/31 17:48了解 而且16MB對任何一個核都是足夠

smallreader 07/31 17:48有可能真的精簡化1CCX 16MB

smallreader 07/31 17:55甚至測cinebench少掉的L3都不影響XD

Windcws9Z 07/31 18:57重點就是比上一代又強又省電 End

oopFoo 07/31 19:26Kraken Point不知還會不會出。現在全力在

oopFoo 07/31 19:27AI上。Strix其實不錯,4大核8小核是蠻平衡

oopFoo 07/31 19:28的設計。遊戲本來就不是筆電的重點。

justicebb 07/31 21:25拉這麼遠勢必受到物理性質限制,要克

justicebb 07/31 21:25服就是增面積跟更耗電更熱

friedpig 08/01 00:17再怎麼樣做得比跨die還慢就是有點誇張了

friedpig 08/01 00:17沒chiplet能搞到延遲比過PCB還慢 有點

friedpig 08/01 00:17神奇

mtc5566 08/01 01:44神奇什麼? 啊就為了省電阿

mtc5566 08/01 01:44比較神奇的是延遲低但跑遊戲還是輸的Inte

mtc5566 08/01 01:44l 到底幹什麼吃的?

canandmap 08/01 11:17孫燕姿:好~~~~~~神~~~~~~奇~~~~~~~~

tint 08/01 19:21Strix Point這顆如果拿來覆蓋中低階產品

tint 08/01 19:23成本應該是偏高的 中低階需要一顆更小核心

tint 08/01 19:25Kraken Point這顆是更精省取向的核心