PTT評價

[閒聊] 前炸G/i皇工程師:僅PROG 5090是安全設計

看板PC_Shopping標題[閒聊] 前炸G/i皇工程師:僅PROG 5090是安全設計作者
oppoR20
(發情豹紋)
時間推噓49 推:50 噓:1 →:66

https://www.reddit.com/r/pcmasterrace/s/MDplPELwNb

文章很長 我們有請ChatGPT完整翻譯

前言與作者背景

首先要說明幾點:是的,我供職於業界的競爭對手。但我向你保證,這一點絕不會影響我的觀點。我提到這一點,僅僅是為了有機會教育大家,或許也對用戶和潛在買家敲響警鐘。曾在 Gigabyte 從事主板設計,不過那已是 17 年前的事了;之後我離開去攻讀博士學位,而過去 13 年我在 Intel 的晶圓廠工作,還短暫待過 ASML。在 Intel 我參與了 14nm、10nm、4nm 和 2nm 工藝的項目,同時也對 Foveros 和 PowerVia 等技術有所貢獻。

此文中的所有內容都是我個人的想法、觀點和數據,完全沒有任何零部件製造商或公司的介入。這是一位硬體愛好者與其他愛好者之間的交流。我並不喜歡不得不這麼說,但現在大家都知道我站在哪一邊了。

背景:其他連接器及各針腳額定值

我們大家熟悉並喜愛的 8 針連接器,其著名之處在於它能夠承受遠高於其標稱額定功率的負荷。根據規範,每個針腳額定 9A,也就是在 12V 下,每個針腳能傳輸 108W,這意味著整個連接器擁有極高的安全裕度,精確來說約為 2.16 倍。而且,如本文後續所討論,這個裕度甚至還可以再進一步擴大。

相比之下,6 針連接器的設計更加“過度”,它通常含有 2 或 3 個相同類型的 12V 線路,也就是說這個額定僅 75W 的小連接器,在其可能的 3 個供電針腳上,每一個都能承擔超過其標稱功率的一部分。即使其中有 2/3 的針腳沒有使用,剩下的針腳仍有餘裕。事實上,單靠一條額定 9A 的 6 針線路,其安全裕度就比在全負載情況下的 12VHPWR 連接器還要高,大約有 1.44 倍的餘量。

其實我在這裡對數值稍作保守處理,因為如今許多知名品牌採用的是 mini-fit HCS(高電流系統)連接器,其額定可以達到 10A甚至更高。甚至在合適的連接器設計下,一個 8 針連接器可能可以使單一 12V 針腳承受全額的 12.5A,但我還沒找到與這個系列完全匹配、額定到 13A 的連接器。如果有人知道有這樣的產品,我確實有興趣獲得一些來做一個 450W 的 6 針連接器。重點在於,只要顯卡的 8 針和 6 針連接器數量正確,基本上除非你故意操作不當或發生嚴重故障,否則連接器熔化的可能性是極低的。

連接器問題:額定過高

接下來我們談談 12VHPWR 連接器。這些較小的針腳並非來自 Molex 的 mini-fit Jr 系列,而是更小型的 micro-fit 系列。雖然仍可使用 16AWG 線材,但這些連接器通常只額定每針 9A或 8.5A,這就引出了問題。

依據 8 針連接器的標準,其要求在 12V 下輸出 150W,即 12.5A,平均下來每個針腳大約需要承載 4.5A。對於額定 9A 的連接器來說,每個針腳實際上只是在其承受能力的一半左右。而在一個 600W 的 12VHPWR 連接器中,每個針腳就需要承載約 8.33A。如果使用的是 8.5A 額定的針腳,則幾乎毫無裕度;即使是 9A 的針腳,情況也不算理想。這些 8.5A 針腳在實際情況下,如高環境溫度、表面清潔不充分或 GPU 的瞬間功率尖峰等條件下,都容易失效,9A 的針腳也好不到哪裡去。

我堅信問題正出在這裡:這些針腳幾乎達到了極限,容錯裕度只有大約 1/6 A,而這對消費級硬體來說實在太少。安全因子極低。按照 9A × 12V × 6針計算,總額定功率為 648W;如果使用 8.5A 針腳,則只有 612W。連接器本身據稱能支持最高 660W,所以假設每個針腳允許有一點超出額定值,或是使用的針腳比我在 Molex 官網上快速查到的稍優,最終的安全因子也只有大約 1.1 倍。

請記住,對於一個損壞的 6 針連接器,即使只有一個 12V 接口在工作,其安全裕度仍可達 1.44 倍。

似乎這個問題業界已經有一定認識和考慮。下圖摘自 2021 年 11 月發布的 PCIe 5.0 附加卡規範第三章 3.3 節,描述了 12VHPWR 連接器感應針的配置:

【圖表說明:該圖表列出了 12VHPWR 標準下,針對不同兩感應針配置的功率限制。
– 當兩感應針都處於開路(open-open)狀態時,啟動功率僅 100W,持續負載時為 150W;– 當兩感應針均接地(ground-ground)時,啟動功率可達 375W,持續負載時最高 600W。】

請注意:啟動功率遠低於經過軟體配置後的持續功率。如果軟體配置後功率沒有提升,那麼通過該連接器的最大功率就只有 375W,這仍是 8 針連接器額定功率的兩倍多。因此,像 5090 這樣本來需要 4 個 8 針連接器的顯卡,可能就可以節省掉 PCB 上一半的空間。375W在 12V 下意味著約 31.25A,四捨五入大約 32A,這樣每個針腳只需承載約 5.33A,這就留有相當的裕度。雖然這個裕度不如 8 針那般寬裕,但考慮到現行規範要求使用的元件品質已經比 2000 年代最劣質的 8 針(僅 5A、20AWG 線材)要高,而且市面上也可能存在額定超過 9A 的 micro-fit 針腳,我認為這樣是可以接受的。目前 4080、5080 及以下型號通常只採用單一連接器,只有部分 OC 版本可能會額外配備第二個 12 針或增加一個 8 針連接器。

如果以之前 6 針連接器中每個針腳 9A 算,總功率 648W,那麼 375W 的額定就相當於 1.72 倍的安全因子。理論上,最少只需 4 個針腳就能承載負荷,剩下仍有約 1.15 倍的裕度。這大致與最劣質的 8 針連接器(使用弱小的 5A 針腳和 20AWG 線材)的安全極限相當。即便是我所見過的最劣質的 7A micro-fit 連接器,其安全因子也大約在 1.34 倍左右。

總結來說,連接器本身並沒有問題,主要問題在於其額定功率定得過高,導致安全裕度極低,這意味著在遇到誤差或其他不完美情況時,很容易超出安全範圍。600W 應該被視為連接器能承受的絕對最大功率,而實際上 375W 才是一個更合理的額定上限。

Nvidia 的問題(以及合作板卡廠商):拆除了保護措施

作為目前唯一使用該連接器的 GPU 製造商,同時又與 Dell 共同贊助此標準,Nvidia 必須對此承擔部分責任,但他們的顯卡合作夥伴也有一定責任。

從 3090 FE 和 3090 Ti FE 的設計來看,可以看出設計師非常注重在連接器各針腳之間平衡負載,將針腳分成 3 對並使電流均衡分布。這正是我記憶中 Nvidia 傳統的板卡設計風格。他們過去在電源傳輸設計方面做得非常出色,我推測這也是為了給合作夥伴樹立榜樣。基本上,他們在這個設計中將 12 針連接器視作等同於 3 個 8 針連接器,藉由平衡各針腳的電流來確保每一組都維持在大約 150W 左右的水平。

在 3090 和 3090 Ti FE 上,每一對 12V 針腳都配有獨立的分流電阻來監控電流,並且板上還有一些電源切換硬體,據我推測這些硬體用來在各針腳對之間動態調整各自獨立的 VRM 相數。不過,我需要進一步檢查 FE 板卡,從更多實物照片中獲取細節來確認這一點。

接著談談 4090 和 5090 FE 板。這兩款板卡將所有 6 個 12V 針腳合併為一個整體,意味著無法在各針腳或針腳對之間進行電流平衡。對於 4090、5090 以及我推測其他使用這種連接器的低階型號來說,這幾乎意味著無法分別監控各個針腳的負載,因為它們只監控整個連接器的總電流。這讓我不禁質疑,到底是誰批准了這種設計——我曾經參與過主板設計,實在無法理解除了節省成本之外,還有什麼理由要去掉這樣一個明顯關鍵的安全特性,而這些成本在大規模生產中只不過是單位數美元甚至幾美分。特別是在 4090 顯卡故障之後,仍然在 50 系列中保留這種設計決策,實在讓人難以接受,因為那時已經有明確跡象表明需要改變。那些連接器在達到額定功率 3/4 時就已經出現故障,但他們卻選擇在沒有對電源電路做出實質改進的情況下,繼續提高連接器中傳輸的功率。

ASUS 以及可能還有其他我尚未提及的廠商,似乎至少試圖緩解這種危險。ASUS 的 ROG Astral PCB 在將所有 12V 針腳合併成一個整體之前,增加了一組第二分流電阻,每個針腳都有獨立的監控。據我了解,這套系統可能無法真正實現針腳間的動態負載轉移,但至少能夠監測到任何異常,從而警告用戶,或者甚至自動採取措施(例如功率限制或關閉系統)以防止損壞或危險。對於允許超過基本 375W 功率通過連接器的設計來說,這應該是最基本的安全要求。

再往上一步的保護措施是,在兩組 3 針腳之間實現主動電源切換,這一點並不難實現,而且對我個人來說,也是我在購買顯卡時最低會接受的要求。3090 FE 顯卡採用的 3 對 2 針腳配置顯示,這樣的方案在實際使用中並未引發頻繁或災難性的故障,也正好屬於這個範疇。

如果有 OC 版本的顯卡打算在單一連接器上超過 575W 功率,那麼對所有 6 個針腳進行監控與切換就應該成為必備條件。就我個人而言,我希望所有超過 500W 的顯卡都具備這種保護,因此每一款 5090,甚至許多 4090 都應該如此。儘管對於如此高功率的顯卡,我仍然希望能有多個連接器,但至少若單一連接器能有這級別的保護,我會更有信心使用它。

未來應採取的措施:避免、退貨與召回

我的觀點是:任何通過 12VHPWR 連接器輸出超過基本 375W 功率的顯卡都應該被避免購買。目前所有僅用單線連接的 4090 和 5090 都屬於此類,而 5080 的功率(約 360W)則處於臨界狀態。

我希望看到那些未採取上述最低保護措施的顯卡被認定為危險且可能存在缺陷,進而被召回。當然,要達到這一點,可能需要對 Nvidia 及其合作的板卡製造商採取大規模的法律行動。這些廠商似乎認為這沒什麼問題,直到消費者把這問題變成自己的問題。

如果你懷疑自己的顯卡可能存在風險,那就退貨拿回你的錢,然後把錢花在別的地方。畢竟,2000 多美元還能買到很多東西。如果他們打算賣給你一個潛在危險、缺乏關鍵安全機制的產品,那他們就不配得到你的錢。這不僅適用於 Nvidia,AMD 和 Intel 也一樣,老實說,對任何公司都應如此。


簡單來說著介面就是爛 容錯率比以往小很多(1.1倍 vs 以往輕鬆2倍以上

這個專業人士也點出前幾天版友提出的問題 就是電源設計部分
都是參照公版電源喇在一起的設計
除了共碩PROG 加入了電流監控 前一篇5080燒起來就是一個很好的例子

但共碩也就只做到監控後打住 也沒進一步得負載轉移或是功率限制(共碩目前應該是只有做到警告而已)
至少式不錯的第一步了
所以PROG這下貴的有理了 ㄎㄎ

你各位啊 搶不到5090或許是好事嗎 ㄎㄎ

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.80.236 (臺灣)
PTT 網址

BJshow 02/13 22:20難怪NV設計5080從上市前的400w>360w 看來

BJshow 02/13 22:20早知道了吧

kaj1983 02/13 22:21那5080超頻的風險就不是當機了,是燒機..

kaj1983 02/13 22:21本以為5080超一下就可以看到4090車尾燈

dragonfly667 02/13 22:23真的超到冒煙

friedpig 02/13 22:24FE真的不知道哪來自信直接把他併起來 等

friedpig 02/13 22:24於那小片上面要直接跑50A

Depthsharky 02/13 22:26避免..看消費者多飢渴

Depthsharky 02/13 22:27召回 看生產端真的有當回事?

william456 02/13 22:27那4090也只剩名人堂可以買

Depthsharky 02/13 22:27退貨(X)囤貨(O)

maplefoxs 02/13 22:28根本就是故意的,8pin用好好的硬要改1

maplefoxs 02/13 22:286pin,結果還不如8pin

william456 02/13 22:28只能期待美國消費者了

maplefoxs 02/13 22:28下一代再換個接頭,各位又可以換電源

maplefoxs 02/13 22:28

william456 02/13 22:29而且夜神也無法做到阻斷吧,僅能告知

william456 02/13 22:29,人不在身邊就

william456 02/13 22:30且目前曝光的工程板是4x16

baddaddy 02/13 22:31沒有安全的,那張卡只是跳通知警告你而

baddaddy 02/13 22:31

twic 02/13 22:32我看要全面停產等5080s了

allyourshit 02/13 22:32就是所有接線狀態必須完美

allyourshit 02/13 22:33幾乎沒什麼容錯空間 一點錯誤就燒熔

a123454698 02/13 22:33電流太高,下一代搞不好走24v

Depthsharky 02/13 22:33跳通知 但模型實驗還在跑(X

a77942002 02/13 22:37終於要開始檢討這個爛設計了?

kuninaka 02/13 22:40600W的16PIN,太危險了

spfy 02/13 22:40他們不可能不知道吧

NanaMizuki 02/13 22:41整個規格的安全冗餘不到10%

sigma9988 02/13 22:42打個遊戲還要分心 電流焦慮

Kismeter 02/13 22:47花大錢買顯卡還提心吊膽

Kismeter 02/13 22:485080也別超了,增加風險

twic 02/13 22:50卡廠利潤不高又搞這高風險 不樂觀啊

E6300 02/13 22:55要阻斷就只能上保險絲了吧

savagy 02/13 22:59好的!!4070 8pin再戰十年(疑?

arnold3 02/13 23:02所以直接用兩個或三個8pin還比較好?

dragon6 02/13 23:05我看以後機殼裡要裝個防火偵煙器了

Richun 02/13 23:183個8pin問題是佔空間太多,但12+4的冗餘太

Richun 02/13 23:18少,在4090/5090對各環節的要求太高了。

Richun 02/13 23:20單6pin標75W,單8pin標150W,單12+4標600W

spfy 02/13 23:24顯卡沒在顧功耗吧 CPU有競爭大家還會看一下

spfy 02/13 23:24誰比較省電 顯卡老黃想要多少電就要給多少

EnosKP 02/13 23:31要電是一回事 要到燒起來是另一回事

EnosKP 02/13 23:32乖乖用4個8-pin當作SLI

coolmayday 02/13 23:3710%容錯??設計這標準接口的人智商堪慮

tagodbless 02/13 23:448pin占空間? 但是PCB只有散熱器的一

tagodbless 02/13 23:44半大小,以5090FE,PCB變大,放個4*8p

tagodbless 02/13 23:44in都輕輕鬆鬆

guogu 02/13 23:44在硬體上雙8pin比12vhpwr可以承受更高電流

guogu 02/13 23:44它們同樣都是6組12V但8pin用的接頭更粗

a1e 02/13 23:448pin時代都沒聽過燒卡,12pin燒卡幾乎每年都

a1e 02/13 23:45有好幾起,這垃圾12pin什麼時候才換啦

guogu 02/13 23:45結果雙8pin額定300W 12vhpwr是600W

jen1121 02/13 23:46怒買5080

jen1121 02/13 23:473090再戰3年

tagodbless 02/13 23:49看5090那可笑的轉接線,1轉4*8pin,然

tagodbless 02/13 23:49後看看4*8pin的總線材粗細,不燒你燒

tagodbless 02/13 23:49誰,延長線插電鍋微波爐熱水瓶,再加

tagodbless 02/13 23:49個烤箱,阿彌陀佛

commandoEX 02/13 23:50所以原本12PIN是正常的,變成PCIE5的

commandoEX 02/13 23:5112VVHP接頭時RATING給太高?

hahn 02/13 23:52之後要換6070開始燒嗎..有夠爛

idolater 02/13 23:5590卡=集體訴訟的入場券 ?

jen1121 02/13 23:57建議 NVIDIA 顯卡只接拉一條插頭,繞過ps

jen1121 02/13 23:57u

Rust 02/14 00:12現在看來買4070的我實在太睿智了

Khadgar 02/14 00:32簡單的說,5090其實根本需要兩個12V 2x6

ChakraLinux 02/14 00:334070唯一的缺點是不能用太大的AI模

ChakraLinux 02/14 00:33

cchpt 02/14 00:45我等AMD

pttyu 02/14 00:48下一代看能不能推24V吧 不然再吃更多瓦怎辦

cutejojocat 02/14 01:035080真的會超到冒煙 原來8pin之前沒

cutejojocat 02/14 01:03什麼問題是留那麼多空間

a77942002 02/14 01:06n*8pin也不是不會有事 要是搞笑 一樣在

a77942002 02/14 01:06接頭處全部並聯 XD

BAKAUSAGI 02/14 01:085080的超頻都是在預設的VF曲線下直接

BAKAUSAGI 02/14 01:08超,總功耗和電壓都是維持預設的不會

BAKAUSAGI 02/14 01:08變。360w下就很能超了,功耗牆拉高到

BAKAUSAGI 02/14 01:08400w反而沒什麼提升空間。

a77942002 02/14 01:10在等一個功率不大記憶體加大的老黃就是

a77942002 02/14 01:10不出~

ctes940008 02/14 01:30算起來,文章裡面傳統8pin是9A*12V,

ctes940008 02/14 01:30這樣至少能跑600W的欸,但標準設300W

iansuture 02/14 01:42燒,看來得降,除了價錢之外的東西

yiting428 02/14 02:11目前pcie公規就是只有12V跟48V好嗎

birdy590 02/14 02:46搞不懂設計的人在搞什麼 前一代就有問題

birdy590 02/14 02:46完全沒解決還繼續... 供電接頭很貴嗎?

castorhome 02/14 03:35沒margin也不做保護就量產 真的有夠

castorhome 02/14 03:35勇敢

cat05joy 02/14 04:08看GN拆ZOTAC也有塞三顆東西方便判斷

cat05joy 02/14 04:08但也有說那個只是方便判斷沒及時效應?

guanting886 02/14 06:51你要設計跟製造兩端公司承認這是一

guanting886 02/14 06:52個爛設計是不可能的

tonyian 02/14 06:56看吧節省成本,就說老黃工程師背景的怎

tonyian 02/14 06:56可能不知道,人家現在刀工也切向電源了

ericinttu 02/14 07:08怎麼會怪華碩 只做到監控後打住 呢?

ericinttu 02/14 07:09這是弄給明眼人巷子內的人看的

boringuy 02/14 08:04省成本啊,不只插頭而已,還有PCB面積

v86861062 02/14 08:04真慘

franchy 02/14 08:06他建議12pin跑375W就好 比3個8pin還低XD

b325019 02/14 08:093mm的針腳還想撐高功耗超級反人類

StNeverRush 02/14 08:10這介面真的很廢 NV想把自己玩死就說

cgalen1994 02/14 08:29路邊隨便找個做水電也會對這種設計保

cgalen1994 02/14 08:29持懷疑態度吧,不曉得大廠在想什麼。

sma1033 02/14 09:06當然是把耐用度做差一點2年後再賺一筆啊

sma1033 02/14 09:06不然大家都不換卡了這生意要怎麼做?

sma1033 02/14 09:07接觸不良這種事情只要金屬接頭氧化高機率

sma1033 02/14 09:07會發生,而且台灣又超級潮濕

sma1033 02/14 09:09讓你一張卡用那麼久幹嘛,早點壞賺更多

kuroshizu21 02/14 10:51耐用度作得差一點讓消費者會比較快買

kuroshizu21 02/14 10:51新的產品是一回事, 但若是因為這樣的

kuroshizu21 02/14 10:52的考量而把接頭做到會燒起來那是不能

kuroshizu21 02/14 10:52容許的, 根本是謀財害命好嗎 XDDDDD

sodastream 02/14 11:25看來還是要買有安全裝置的卡啊

sodastream 02/14 11:25沒想到連幾美分的成本也要省

ericinttu 02/14 11:33你要自己舉證有謀財害命啊