PTT評價

Re: [情報] 假的!NVIDIA 3060 算力限制被破解了

看板PC_Shopping標題Re: [情報] 假的!NVIDIA 3060 算力限制被破解了作者
jk21234
(BL2400PT真不錯)
時間推噓15 推:15 噓:0 →:73

※ 引述《tint (璇月)》之銘言:
: 隨著消息的傳播
: 目前有愈來愈多的相關測試結果
: 根據Reddit和Gguru3D網站上一些討論的留言歸納:
: 1.不限定微星的RTX3060
: 各廠牌RTX3060搭配470.05BETA驅動

之前比較少回文

不過原本就站在這東西遲早能破的那邊

因為對3060算力減半這件事情
實際上是在系列硬體已經出了一段時間才有的

所以應該不是在bios端鎖而是在driver端鎖
鎖的方法可能是compile針對特定的指令增加nop/latency,
或者是在這款硬體CL/CUDA啟動的時候寫入特定的setting register能影響速度

這件事情在driver內就像 我有一個門 原本前一陣子上市的硬體
拿了200-233號的磁卡 而今天開始發234號以後的卡
可是這些卡只能走新開的繞比較遠的門.打不開舊的門

破解的方法不是想辦法仿造出233號以前的卡,
只要門本身拆得掉你不能仿造卡本身就不會是問題

畢竟像SLI需要主機板支援這點最後也是破解了

不過假如沒有這次的出包,就是需要從driver
端逆向去找甚麼地方在檢查"大部分Ampere卡都用 而只有3060不能用"
的路徑 這個行為雖然在driver裡不過大概還是在user mode下可以追

但原本獨立找這個所花的時間不知道多少 今天這個driver
出現後,除非硬體有重新更改後再tapeout...不然新出的硬體和已有的晶片
屬於相同系列就等於再也鎖不住

實際上跑出這份driver可能也不是陰謀論
因為這種正常功能完成後才叫開發者在釋出日前新增/封鎖功能的
偶有這種情況.......

例如各模組以為都有對應的#ifdef但是整合起來build就是在某些模組沒有套用到
或者是開發者自己改來測舊code沒有廢掉不能用就上傳了

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.246.243 (臺灣)
PTT 網址

tint 03/16 00:26之前推測它實作方式可能是透過VRAM位寬減半剩96bit

tint 03/16 00:27因為算力限制時 VRAM溫度相比沒限制時低一些

傾向認定不是 因為現在也有遊戲混用gpgpu 一但修改頻寬它也很慘... 不過可能是改特定指令/l2/store等 的延遲 改長等於單位時間內讀寫也變少 當然比較涼一點

aegis43210 03/16 00:29怕影響到某些遊戲,所以頻寬減半最安全,全鎖可能影

aegis43210 03/16 00:29響到某些遊戲的體驗

遊戲沒頻寬也慘

JoyRex 03/16 00:29這種可以破,那Quadro是怎麼鎖?還是也破了87趴?

tint 03/16 00:29或者是硬體底層降低VRAM的供電/時脈

AreLies 03/16 00:30沒有破解啊 只是閃過限制而已

JoyRex 03/16 00:323060現在靠BETA驅動繞過去了,quadro有類似情形嗎?

unified driver時不管n或者a都有 某版driver跑gl專業軟體速度暴增 只是不知有意或者意外

AreLies 03/16 00:32就剛好Beta驅動沒有完全限制

JoyRex 03/16 00:33不然差不多規格貴那麼多,怎麼賣?

AreLies 03/16 00:34Quadro驅動跟GeForce 分家很久了

Saza 03/16 00:35老黃出這一手3060要賣翻了

tint 03/16 00:35不過看討論區 有些人的3060搭配這BETA版驅動

tint 03/16 00:36ETH算力還是無法達到40MH/s以上

tetani 03/16 00:41微星的3060是目前成功率100%的嗎?

hentai1989 03/16 00:42猜測應該是要有足夠的PCIE通道吧,通道不夠就鎖算力

tint 03/16 00:45而且還必須要接顯示器

tint 03/16 01:02不,它並不是直接全面鎖顯示卡VRAM位寬

bit寬度是全體的狀態 會不全面嗎 而且你在3060上少了96bit也會有3gb讀不到 要是剩3gb還能解應該跟實際不符

tint 03/16 01:03https://youtu.be/282Ozbp-Uv8

tint 03/16 01:04這是之前測試降低ETH算力的影片 一開始它會以正常

tint 03/16 01:04算力執行 但觸發了NV的反挖礦機制後 算力才降到一半

ccdrv 03/16 01:05欣亞msi的3060都被掃了

tint 03/16 01:07但像其他KAWPOW和Octopus這些一樣佔用DAG且頻繁存取

tint 03/16 01:07VRAM的算法 卻完全沒有觸發反挖礦機制而降低算力

tint 03/16 01:08根據NV之前新聞稿 它說是僅針對ETHash算法去限制

tint 03/16 01:09https://tinyurl.com/2rf5b8m9 之前這一篇新聞

hentai1989 03/16 01:09根本就不需要那麼多陰謀論,老黃能混到今日的名堂

tint 03/16 01:09RTX 3060 software drivers are designed to detect

hentai1989 03/16 01:09絕對比你我、比板上任一個人都更間巧、更老奸巨猾(O

tint 03/16 01:10specific attributes of the Ethereum

hentai1989 03/16 01:10你我想得到的,老黃有可能會想不到嗎?

hentai1989 03/16 01:10玩家的錢老黃要賺,礦工的錢老黃當然也要賺

tint 03/16 01:10cryptocurrency mining algorithm, and limit

hentai1989 03/16 01:10所以老黃要推礦卡,只要礦工買礦卡老黃就能賺更多錢

tint 03/16 01:10the hash rate, or cryptocurrency mining

hentai1989 03/16 01:10想想為什麼會有新beta驅動?啊不就3080Ti快要出來了

tint 03/16 01:10efficiency, by around 50 percent.

hentai1989 03/16 01:11今天只鎖ETH算法,但以後呢?想要礦工願意去買礦卡

hentai1989 03/16 01:11那遊戲卡對挖礦的限制設計就要越來越嚴格

hentai1989 03/16 01:11但算法鎖越大,沒人能保證以後遊戲效能不會被砍到

tint 03/16 01:11NV聲明很明確說只限制Ethereum mining algorithm

hentai1989 03/16 01:11所以這新beta驅動會特別針對挖礦限制做這樣的設計

hentai1989 03/16 01:12大概就為了之後的3080Ti、和之後尚未出世的顯卡鋪路

tint 03/16 01:12其他挖礦算法不防 這樣很可能就是針對特定計算指令

hentai1989 03/16 01:12反正遊戲玩家買顯卡玩遊戲,當然都插x16或x8

hentai1989 03/16 01:12那以後的驅動對算法限制再大,也不會砍到玩家效能

tint 03/16 01:13ETHash算法來說 會使用到SHA-256和SHA-512雜湊函數

tint 03/16 01:13它可能就是針對特定計算指令去觸發反挖礦機制

tint 03/16 01:14一般遊戲用途、通用運算 並沒有觸發反挖礦機制

tint 03/16 01:14所以也就沒有VRAM位寬被限制的問題了

tint 03/16 01:21在沒觸發反挖礦機制前 3060硬體運作值應是完全正常

tint 03/16 01:32如果它驅動程式端會針對特定的指令增加nop/latency

tint 03/16 01:33那麼應不會看到一開始約30秒時間是正常ETH算力

這就是對gpgpu環境不夠理解了 它隨時都可以recompile 事實上n和a的環境使用clcompile 得到的東西並不是直接給硬體執行 到最後clenqueuendrangekernel之內(這會持續執行無數次) 還會再針對硬體轉譯(用cuda的話原理相同不贅述) 開頭和後期跑的內容自然可以效能不一樣 當然我沒前面說法都沒否定用硬體設定影響的可能性

tint 03/16 01:35可見它可能是偵測特定計算指令才觸發了反挖礦機制

tint 03/16 01:44之前有外國網友測試讓3060同時挖ETH和CFX幣

tint 03/16 01:44就是同時跑ETHash和Octopus二種算法

tint 03/16 01:453060在單獨跑Octopus算法時 算力是正常的45MH/s

tint 03/16 01:46但是二種同時跑 Octopus算法的算力也跟著出現大幅

tint 03/16 01:46滑落到一半以下的現象

※ 編輯: jk21234 (1.169.246.243 臺灣), 03/16/2021 02:14:50

GoGoJoe 03/16 09:00講那麼多 破解了沒?

gbman 03/16 12:32就沒破啊,新卡出來防堵一下繼續鎖CC

oopFoo 03/16 15:02還有一個方法,cuda thread自動減半。

tint 03/16 17:56我認為它如果compile針對特定的指令增加nop/latency

tint 03/16 17:57在挖ETH時會直接就呈現減半的算力 而不會一開始先

tint 03/16 17:58跑出正常的算力一段時間 之後才快速下降至減半值

tint 03/16 17:59這個情況會像是顯示卡硬體運作數值在調降造成的

tint 03/16 18:00就像如果你在挖ETH途中 去突然即時拉低PL或VRAM頻率

tint 03/16 18:01它的算力會呈現類似的下降狀態

tint 03/16 18:04另外 3060規格是12GB 單顆2GB共6顆組成192bit

tint 03/16 18:05我意思是如果它96bit時是從IMC控制通道數下降一半

tint 03/16 18:06但要觸發反挖礦機制時才會發生 平常各應用時都正常

tint 03/16 18:07我還是傾向認為它是觸發反挖礦機制時 才會調降顯卡

tint 03/16 18:09的特定硬體運作數值 而不是直接就針對特定的指令去

tint 03/16 18:09增加nop/latency 這樣影響的層面較大

tint 03/16 18:11顯卡運作上分為正常狀態和觸發反挖礦模式二種狀態

tint 03/16 18:11這樣影響層面會較小

oopFoo 03/16 18:19是啊,調整thread也是大概同樣效果,scheduler慢慢

oopFoo 03/16 18:20的減少thread。但實際如何,只有N知道

tint 03/16 18:22減少thread方式的話 這樣就也能說明存在二種模式

tint 03/16 18:24因為像ProgPow、KawPow、Octopus這些吃重核心運算的

tint 03/16 18:26挖礦算法完全沒影響算力 目前已知受影響的挖礦算法

tint 03/16 18:27有ETHash和Verthash 這二種算法都會呈現算力減半

tint 08/15 19:29目前已知LHR(鎖算力)顯示卡 應該是

tint 08/15 19:29藉由降低IMC負載來達成限制算力的

tint 08/15 19:30效果 IMC最大約只能達到66%負載

tint 08/15 19:32目前一些能部份解鎖算力的挖礦程式

tint 08/15 19:33就是藉由提高IMC負載 達到部份解鎖

tint 08/15 19:33算力的效果