Re: [情報] 4090太強 12900K/5800X3D都成瓶頸

oopFoo 發表於 2022/10/13 上午9:41:45

看板PC_Shopping標題Re: [情報] 4090太強 12900K/5800X3D都成瓶頸作者

(3d)時間Oct 13 09:41:45 2022推噓59 推:61 噓:2 →:131

※ 引述《oppoR20 (發情豹紋)》之銘言：
: 已經不只一家評測指出這個問題了
: https://bit.ly/3MnaQNi
: TechSpot:5800X3D
: 1080p/1440p下會有CPU瓶頸
: https://i.imgur.com/ZPHXSHw.png

: Techpowerup/Techspot兩家測試都很明顯 4k之外都被cpu瓶頸了
: 尤其TPU用更弱的5800X讓4090效能無法發揮完全
: https://bit.ly/3yU7Anl
: PCMAG:預設功耗下會讓12900K成為瓶頸
: https://bit.ly/3rNegPU
: PcWorld:快到4K以下幾乎都會造成瓶頸

https://www.chiphell.com/thread-2450201-1-1.html
https://i.imgur.com/xE4FJkD.png

其實不是CPU跟不上，是4090裡面的Front End(FE)跟不上。

了解為什麼老黃不願意改進FE，現在臭打AI更重要，而且Mesh Shader如果普及會減輕FE的壓力。

但能把缺點講成優點，老黃的宣傳部門實在厲害。

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.221.53 (臺灣)

※ PTT 網址

→

meicon556610/13 09:44結果又是老黃的鍋

推

sigma998810/13 09:51坐等50卡

推

ISAF10/13 09:53風向又變了大人

推

ikarifaye10/13 09:53什麼鍋這是刀法

推

joe19927710/13 09:55老黃的刀法...真的好強....

推

Riya52010/13 09:56皮衣刀客正盯著你

推

dylantu10/13 10:11老黃沒有缺點消費者才有

推

LastAttack10/13 10:14神前刀工，規格冗餘是為了4090ti留後路，架構冗餘是

→

LastAttack10/13 10:14為了50系列留後路

推

GermanGerm10/13 10:17有人可以幫硬體麻瓜解釋一下FE是什麼以及為什麼造成瓶

→

GermanGerm10/13 10:17頸嗎QAQ

→

tactics210010/13 10:30應該改成主機卡插顯示板了貴成這樣不操個十年說不

→

tactics210010/13 10:30過去

→

oopFoo10/13 10:31fe是前端。現代的gpu雖然vertex/pixel shader是共用的，但

→

oopFoo10/13 10:32前面還有一個專門處理三角形的前端，這個triangles/s就是

→

tactics210010/13 10:32既然強成這樣那就不要焊死做成像cpu一樣可以換晶片

→

oopFoo10/13 10:34處理能力。看不見的三角形就在這拋棄，點(vertex)也在這算

→

tactics210010/13 10:34就算效能會降一些應該還是卡cpu瓶頸

→

oopFoo10/13 10:34出。Ada這一代看起來fe太弱，跟不上shader的處理能力。

→

friedpig10/13 10:36Ada本來傳言就是 ampere 台GG版靠GG製程規模拉大很多

→

oopFoo10/13 10:36Mesh Shader可以一次處理一堆三角形，可以降低fe的壓力，

→

friedpig10/13 10:37傳統性能部分看起來改變不大暴力+大而已其他進步都在

→

oopFoo10/13 10:37但現在用Mesh Shader的遊戲還很少。

推

MoneyBlue10/13 10:51看來是遊戲程式設計跟不上老黃

噓

a00000000010/13 10:55幹尼老黃

推

aegis4321010/13 10:58主要的改善在即時光追，GPC的主要變動是L2變大

→

friedpig10/13 10:59看下一代狀況吧下一代還有MCM 整體應該會改更大

→

friedpig10/13 10:59不過這代用GG已經不錯了可以戰蠻久又不熱

推

aegis4321010/13 11:02所以效能爆增幾乎都是GG的貢獻

→

hong41410/13 11:02遊戲廠的問題不關我們老黃的事配合nv是他們的責任

推

nmkl10/13 11:04看來等蘇媽的了

噓

as663320810/13 11:12沒邏輯，各大測試結果很明顯就是cpu瓶頸的特徵。按你說

→

as663320810/13 11:12數據會「塞」在gpu前端，不就代表gpu根本還沒完成圖像

→

as663320810/13 11:12運算就請求下一個運算數據？這樣的話是不是只要跑個一

→

as663320810/13 11:12兩小時，前端就會卡一卡車的數據，然後就開始變慢了？

→

as663320810/13 11:12你確定？前端問題應該是gpu瓶頸吧？你當那些測試的連gp

→

as663320810/13 11:12u瓶頸跟cpu瓶頸都分不出來嗎？

→

as663320810/13 11:19找個中國論壇不知到什麼咖的鄉民的廢文，就想推翻cpu瓶

→

as663320810/13 11:20頸測試結果，我也是笑，資料嚴謹度比維基百科還廢

→

oopFoo10/13 11:42我開始寫3d程式是比老黃的tnt還早。從triangle setup開始

→

oopFoo10/13 11:43T&L，geometry/hull stages，compute, mesh shader，幾乎

→

oopFoo10/13 11:45通通都經歷過。從cpu做culling，變成coarse culling，現在

→

oopFoo10/13 11:46再變成mesh shader來culling。Mesh Shader 其實跟ps2的vpu

→

oopFoo10/13 11:46與ps3的spu很像。硬體，軟體的變化，算是都跟上了。你要說

→

oopFoo10/13 11:47我比那些只會測試的人不懂？

推

keyman210/13 11:47看不懂但是好厲害的樣子

→

oopFoo10/13 11:50ada的triangles/s的rate都出來了，瓶頸在那已經很清楚了

推

jimmyyang20710/13 11:52那懂哥可以幫我們科普一下為何有些測試看起來跟CPU

→

jimmyyang20710/13 11:53的性能有直接關係呢？感恩

推

ddrbox10/13 11:53若是DL/ML用途，是不是FE的壓力就沒這麼大？

推

boren10/13 11:56我也不明白，所以是只要畫面的三角形太多GPU就跑不滿？

→

a8513913810/13 12:01原來有行家啊

→

a8513913810/13 12:01也想請教一下前端的triangles/s

→

a8513913810/13 12:01造成的瓶頸，CPU是怎麼cover的

推

a4535110/13 12:05所以是cpu在強也沒用嗎

→

oopFoo10/13 12:06dl/ml用不到這個fe。對，太多三角形就shaders在等。

→

oopFoo10/13 12:07現在的triangles很多都是gpu自己在產生的，cpu只是下指令

推

aimlin10/13 12:08硬體不是nv的問題是消費者的問題

→

oopFoo10/13 12:08而已，很多傳統cpu在處理，能轉到gpu處理的都轉過去。cpu

→

oopFoo10/13 12:10在這能幫助的很有限，基本上現在3d繪圖程式的優化都是如何

→

oopFoo10/13 12:10讓gpu能全速前進，cpu盡量不要去打擾。

推

Nonegrame10/13 12:10可以開始等5090了

推

twinkleAshed10/13 12:13Ada是不是架構沒有跟上整個硬體規模才會卡住?

→

twinkleAshed10/13 12:13如果簡而言之的話?

→

ileva332410/13 12:14等50+1

推

LiNcUtT10/13 12:19故意留一手啦,不然50系要出啥XD

→

LiNcUtT10/13 12:20反正牛肉端一半就打死競品了,沒必要一次全上完吧

推

landy091010/13 12:22看不懂（ry

推

Supasizeit10/13 12:23不然你要買AMD

推

ddrbox10/13 12:23了解，換言之，4090的目標客群是專業市場，遊戲只是附加

→

ddrbox10/13 12:23的

推

Bencrie10/13 12:27理想狀況就是送很少的資料能畫很複雜的圖

推

BraviaX95j10/13 12:28我就問front End是什麼？

推

huhu1230123110/13 12:32既然你懂這麼多幹嘛要貼對岸文寫一篇提升一下板上

→

huhu1230123110/13 12:32水準呀

推

vig07710/13 12:38昨天還在吹==

推

smallreader10/13 12:38推專業解釋幹你老黃

→

commandoEX10/13 12:40或許也可以說是4090的目標已經不是fhd這些解析度不是

→

commandoEX10/13 12:40嗎？

→

intela0325210/13 12:41大概就是要你積極啟用dlss那些東西吧

→

intela0325210/13 12:413080ti dlss開起來也不太容易感覺出畫質減損了

→

intela0325210/13 12:422077不開dlss真的很難衝高幀數

推

poi9630010/13 12:5313代解禁後效能提升 GPU使用率提高時我看你怎麼解釋

推

ronald27910/13 13:02看不懂QQ

→

oopFoo10/13 13:20其實就是取捨，AI/RT比較重要，Mesh/Task Shader普及後，

→

oopFoo10/13 13:21FE的瓶頸也就解除了。某方面也是戰未來。

推

TaiwanBeijin10/13 13:26原po或許是架構上專家但卻不是商業成本的專家講

→

TaiwanBeijin10/13 13:26的東西經常只看架構而忽略製造成本

推

leviva10/13 13:31如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不開跟309

→

leviva10/13 13:310 Ti的差距，證明cpu瓶頸完全是偽概念（而且買4090的,

→

leviva10/13 13:3199.99% 開4K畫質，完全不受影響）

推

KoiKaze10/13 13:56優文

推

sx415210/13 13:58合理阿怎麼可能現在這麼強的cpu會是瓶頸

推

google6041110/13 13:59太難懂了拔草測風向

推

ctes94000810/13 14:07不明覺厲

推

sdbb10/13 14:08

→

LiNcUtT10/13 14:2313代解禁後就知道了,剩一個禮拜

推

NodeWay10/13 14:40看13900k有沒有提升就知道了

→

NodeWay10/13 14:41終於等到13900+4090了

推

rickie114110/13 14:53拔草測風向

→

bbest10/13 15:26levi大講到重點,等13代解禁就知道這篇是神預測還是喇叭文了

推

mrme94510/13 15:30已經有人拿7950X測過了，一樣瓶頸呀

→

gbcg972510/13 16:10等等黨又可以等50了

→

ddfg10/13 16:12因為現在cpu都在劑牙膏

推

kuninaka10/13 16:12這篇的解釋合理啊，FE無能讓後端的shader在等

推

RaiGend051910/13 16:13大神出沒

→

kuninaka10/13 16:13以前CPU負責送三角形現在是GPU自己送

→

ddfg10/13 16:14講得好像13代很神一樣，製程沒變化還不是12代再捏上去

→

kuninaka10/13 16:15遊戲設計跟不上老黃XDD

→

minipopy031410/13 16:16我都在等100系了老黃你快改阿

→

www12344210/13 16:49CPU佔用才20~30%講CPU瓶頸不然是要做到單核10GHz嗎？

→

tactics210010/13 16:53那是因為很多遊戲不支援全核運作(常見的就1～4核)

→

tactics210010/13 16:54遊戲會卡但是遊戲以外的軟體不卡

→

ltytw10/13 17:35不可質疑你的老黃你NV價值不足？難道你要買AMD？

推

lee98832510/13 17:54cpu有可能是單核瓶頸可是評測的沒秀只能猜測

推

wantsu10/13 17:55你可以買i皇的顯卡，弱到CPU絕不可能是瓶頸

→

fywei10/13 17:56敢嘴老黃你 ...

→

a2741733210/13 18:02有點好奇為什麼每週期的三角形處理率變低

→

a2741733210/13 18:03可以推到瓶頸是在前端的結論？有其他數據證明嗎？

推

CORYCHAN10/13 19:12O大好資深

→

a8513913810/13 19:23你還是沒有解答為何5800X和X3D

→

a8513913810/13 19:23會有差距，就是因為看到這個差距

→

a8513913810/13 19:23加上FHD提升非常有限，我們才覺得

→

a8513913810/13 19:23可能跟CPU有關，如果真的是FE原因

→

a8513913810/13 19:23那有辦法解釋這個結果嗎

推

ipspro10/13 21:16等13900k解禁不就知道是不是瓶頸了

推

tint10/13 21:37發表會公佈的GPC結構圖就可以看出SM結構沒什麼改變

→

tint10/13 21:39這次ADA的結構沒有大改主要是頻率拉高、加大L2、增加SM規模

→

tint10/13 21:40這篇推算出前端的效率看起來合理前端效率沒跟上規模的增加

→

tint10/13 21:45另外 N卡對於CPU效能較依存的現象這是從Kepler就開始的

→

tint10/13 21:48因為從Kepler架構開始 NV將Scheduling過程一部分轉移給CPU

→

tint10/13 21:49來處理所以Fermi之後的架構 NV的GPU對CPU的依賴會相對高些

→

tint10/13 21:50但NV這樣做的好處是可以大幅降低CUDA執行緒上的延遲

→

tint10/13 21:51架構簡化亦能進一步提昇GPU的能耗比

→

savagy10/13 21:56終於等到t大開釋，雖然還是看不懂

推

tint10/13 22:14當年GTX600系列發售後就有一些關於新GPU對CPU依賴性的測試

→

tint10/13 22:15http://vga.zol.com.cn/290/2906445.html 當時對岸的測試文

→

tint10/13 22:16#1OubQ0fR (PC_Shopping) 板上有人po過的解析文章

→

tint10/13 22:17https://i.imgur.com/Kq7zjHs.png

→

tint10/13 22:18Kepler架構後Scheduling過程的一部分由驅動交由CPU處理

→

tint10/13 22:20所以原標題依賴CPU和本篇前端處理效率跟不上覺得都是合理的

→

tint10/13 22:25GPU的發展方向每隔幾年都會有一些變革現在也許又到變革期

推

aegis4321010/13 22:265800x3d表現比較好是因為L3大，指令命中率更高，使GPU

→

aegis4321010/13 22:26前端壓力變小

→

tint10/13 22:30早年3D加速晶片->硬體T&L進入GPU時期->統一著色器架構時期

→

tint10/13 22:31繪圖晶片從早年狂堆多邊形生成效能轉為重點擺在著色器效能

→

tint10/13 22:33到現在強化單/半精度效能強化AI效能和加入光追功能

→

oopFoo10/13 22:46那個解析文章，亂扯一通，完全不懂drawcall的瓶頸是什麼。

→

oopFoo10/13 22:48vulkan/dx12很複雜，效能沒有提昇很多，因為每個遊戲都需

→

oopFoo10/13 22:49要一堆PSO(Pipeline State Object)。每個pso都需要編譯，

→

oopFoo10/13 22:50編譯沒辦法即時，micro stuttering比以前更厲害，Steam為

→

oopFoo10/13 22:51了解決這個問題，cache pso起來，所以steam cache吃一堆。

推

kuninaka10/13 22:52上面PO電蝦那篇文章被中國人吐槽，亂扯一通XDD

→

kuninaka10/13 22:52"這篇文章屬於牛頭不對馬嘴的典型例子，作者甚至不知道

→

kuninaka10/13 22:52自己在說什麼，居然把任務調度和sm內的指令調度混為一談

→

kuninaka10/13 22:52。"

推

kuninaka10/13 22:55https://i.imgur.com/SuG1ncR.jpg

→

oopFoo10/13 22:55硬體廠商故意混淆，也是造成大家誤解的一大原因。

→

kuninaka10/13 22:55低解析度4090跟3090差不多

→

kuninaka10/13 22:56啊就卡在前面，後面爆幹強也沒用

→

kuninaka10/13 22:56高負載才有用武之地

→

kuninaka10/13 22:56其實也是好處？

→

kuninaka10/13 22:56低負載買這麼強的卡炫富其實沒必要

推

tint10/14 01:10https://tinyurl.com/4nb6yr28 後藤弘茂專欄講解Kepler架構

→

tint10/14 01:10https://i.imgur.com/hpGLask.jpg

→

tint10/14 01:12Fermi架構中Scheduling過程是有一部份移交給CPU處理的

→

tint10/14 01:14當年的NV技術文件也有提到所以那篇解析文的立論是對的

→

tint10/14 01:14只是後面它提的DX12這可能就他自己的觀點

→

tint10/14 01:22那個中國人吐槽可能也沒去看過NV當年Kepler的技術文件

→

tint10/14 01:23上面第三行沒打完整應是Fermi架構後的Kepler架構

→

tint10/14 01:33SM中的平行處理調度當然還是硬體層外移的是Pre-Scheduling

→

oopFoo10/14 06:19kepler只是把job board移出來而已。gpu其實很早就有cpu在

→

oopFoo10/14 06:21裡面，Nvidia早在2016年就換RISC-V，比其他人都早。但Job

→

oopFoo10/14 06:22Board跟Scoring這些東東本來交給主機的CPU是比較適合的。

→

oopFoo10/14 06:28CPU管大的，gpu管sm的thread，各有適合的。但這影響的不是

→

oopFoo10/14 06:28效率，是成本。

推

kaltu10/14 07:00所以是GPU上內建的CPU瓶頸了，不是主板上那顆

→

oopFoo10/14 07:13瓶頸的是geometry engine，也不是內建的cpu。那個就是專門

→

oopFoo10/14 07:16處理三角形該怎麼對應到frame buffer上。

→

oopFoo10/14 07:21以前是歸類於前端(FE)，但現在中段也會用的到。

推

ltytw10/14 07:32推t大

推

CharleneTsai10/14 10:57結論等50看看

推

a8513913810/14 11:42感謝o大t 大解釋，雖然沒看很懂

→

a8513913810/14 11:42先存起來再說

推

boren10/14 12:54我還好奇的是，為什麼4K能比1080P使用率更高？1080P的三角

→

boren10/14 12:54型比較多？應該不是吧？

推

tint10/14 13:50衡量GPU效能一項指標是填充率一般主要會指像素和紋理填充率

→

tint10/14 13:52當解析度愈高 GPU要渲染的像素也愈多每秒能繪製格數就下降

→

tint10/14 13:53所以boren是指哪方面的使用率？

推

boren10/14 14:07就是工作管理員能看到的GPU使用率，但你這麼一說我懂了，解

→

boren10/14 14:10析度高的時候GPU就加重別的工作了，這時front end就不需要

→

boren10/14 14:10拼命畫三角形了

推

LastAttack10/14 16:11CPU瓶頸論者幹嘛一直喊13900k==也就多兩簇小核、時脈

→

LastAttack10/14 16:11拉一成

同系列文章

[情報] 4090太強 12900K/5800X3D都成瓶頸

```
32 
```
首PooppoR20：已經不只一家評測指出這個問題了 TechSpot:5800X3D 1080p/1440p下會有CPU瓶頸

其他人也閱讀了

PTT 熱門相關