Re: [閒聊] ECC記憶體究竟有多大用?NAS真的需要ECC
※ 引述《HamalAri (哈馬‧阿里)》之銘言:
: ecc 倒底有沒有用還真的很難說
:
: 最近出包老是同一地址,而且是 scrub 時抓到的
: 代表不是大量計算時發生,是閒閒沒事幹時抓到的
:
: 是這條有 defect 嗎? 還是我被駭了,有人在玩 rowhammer ?
: https://i.imgur.com/1KHKE6b.png
就單純壞cell
記憶體也是半導體元件
如果你的CPU、顯示卡、主機板都不會壞
那才有可能說記憶體也不會壞
很多關於ECC的說法是為了防止傳輸時有bit翻轉
老實說我是一頭霧水
如果傳輸到會發生bit翻轉
那eye pattern這關根本過不去
這主機板的RD要拖去斃了
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.57.57 (臺灣)
: ※ 文章網址: https://www.ptt.cc/PC_Shopping/M.1655099070.A.183
: 推 wei115 : 不是說ecc無用 而是說ecc對於家用的 220.134.21.189 06/13 13:55: → wei115 : 影響被誇大了(在ecc價格虛高的情況 220.134.21.189 06/13 13:56
我覺得這是最糟糕的說法
什麼是"家用", 我家NAS不能放我那已過世的狗狗照片嗎,
應用從來不是分家用不家用,
而是分資料對你有多重要
: 推 wei115 : 況且各家nas廠,入門級別的機種, 42.76.32.34 06/13 14:28: → wei115 : 也都沒ecc 42.76.32.34 06/13 14:28
就錢而已啊
ECC是什麼成本,
RAM + 12.5%, MC早就內建, 以及約2%的效能
那是個事嗎, 不是
為什麼不做, 因為消費者不懂
懂的人是少數
學過檸檬車效應嗎?
"如果你分不出吃到嘴裡的是咖哩還是大便, 你永遠只會吃到大便"
那為什麼硬碟有人做RAID1,
那是因為很多消費者都嚐過硬碟故障的滋味了
--
客戶要 所以我連上個廁所都要ECC
如果你控制各種括約肌的記憶放在RAM上的話
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 15:06:57bit翻轉不是說宇宙射線引起的嗎?
宇宙射線引起的bit翻轉 一個address應該頂多遇過一次 cell 壞掉、或是address decoder壞掉 就是固定那邊會出錯 宇宙射線引起的我是沒看過 (也許是遇到也不知道) 但cell壞掉是常常遇到 我現在在用的這台5700G RAM就是新品故障 有Cell是壞的
位元翻轉難的是苦無證據,但它真實存
在
ecc、non ecc的價差一倍,同樣64g
ram資料可以多一倍副本,以資料安
全的視角後者是否更可靠?
就跟你說成本是+12.5% 貴一倍是商人看你沒辦法薛你的 聽不懂膩
不是說ecc不重要,而是預算有限的
情況下,投資ecc是否有效益
沒 ecc 要怎麼知道哪份是對的? 單
純有 raid1 沒 checksum 也沒辦法
scrub. 而且記憶體要是有問題, 有
raid 或有 checksum 也沒用, 除非
你運氣好都是遇到久久發生一次的隨
機 bit flip, 單純舊了過保了不穩
了的記憶體沒 ecc 要等到當機才會
發現
阿幹,我買到就貴兩倍 要是一條ecc
只貴12.5% 跟進插屁眼拉= =
所以啊 你在那邊附和ECC是貴的沒必要 就是上了這些奸商的當 然後因為上了奸商的當 所以ECC就會繼續貴 就繼續沒必要 搞清楚一下狀況啊
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 15:34:27樓下來個白算盤開課八
@HamalAri 你討論的風險當然存在 但
蝦皮dell那隻不貴啊
更多風險的是什麼?是沒有良好備份
2千多16g好像
當手上絕大多數資料只有一份的情況
下 比起投資ECC更重要的是投資備份
不是這個洞不大 而是優先補更大的洞
奸商又不是我能控制的= =
那你就繼續助紂為虐吧 至於投資在什麼上重要不重要 確實 如果你錢只夠再買一顆硬碟 不夠多買ECC記憶體 那確實是該先買硬碟 但這也代表你的資料就只值這點錢而已
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 15:41:06有人大概以為 ram 出錯只會出錯在
資料上, 要是今天這個 bit flip 發
生在你的備份程式上呢?
Linus也噴過阿 把一個基礎功能當高
集功能加價賣
板上一堆人用windows存自己的資料
一堆亂比喻 排泄物又出來了
資料消失是壞軌還是ram出錯更多?
文字沒有好好寫 再專業也沒用
難道你沒有做防彈車出去 你的命只值
值這一點錢 資料重要性跟花多少錢保
護是兩回事
是誰亂比喻 笑死 在台灣你聽過幾個人在路上被人開槍? 我自己的RAM倒是新品就故障 這機率是能比喔?
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 15:45:40更何況絕大多數人電腦存放的都是對
一兩個bit翻轉不敏感的圖片、影片
如果他有用什麼zip、rar打包就知死了... 很多人壓縮不是為了省空間、而是為了包成一包好整理
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 15:47:20另外會分享這部影片 只是當初組電腦
的時候被太多人強調ecc了 但實際上
防彈車如果一個月月租300NTD 那是該
坐防彈車
然後一般人應該是不值得買防彈車沒
錯
我的需求 資料量只有3T 評估的時候e
cc權重本就不高 然後窮
ecc也不是100%保證 你不認為你壓縮
是在增加風險嗎?難道你資料不重要
ECC是100%保證可以檢出錯誤 讓你有修正的機會 你要先去搞懂ECC跟RAID 1的意義 是完全不同的
我是在學你 我也認為需要做防彈車
但人命還是很重要 有人認為他不需要
ECC 但他的資料還是很重要 一樣道理
更正 我也認為"不:需要坐防彈車
我這輩子自用的PC 遇到有壞Cell 大概已經四、五條了 加上親友故障的 上幾十條都有了 不知道閣下住哪 開個車被開過四五次槍 嘖嘖
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 15:56:42你ECC要怎麼偵測3bit錯誤?
你說的是單列奇偶校驗 ECC是行列奇偶校驗 當然可以偵測
好可怕… 這串釣出一堆年度幹話金句
請問PC記憶體無ECC,NAS記憶體有EC
C的情況,PC傳資料到NAS,若PC記憶
體有你說的問題,這樣NAS存的資料
,還會是正確的嗎?
有可能是錯的 所以最好是全部的系統用ECC
評估一項東西都是成本和風險的權衡
無視成本或風險都沒有討論價值
我的狀況就是沒有錢,那我自然選擇
風險更高的方案 但同時盡量壓低風險
到底在講三小,沒錢所以選風險高
然後又要花錢壓低風險
在講三小喔, 就是在講不要在那鼓吹 "ECC沒用, 不值得你花兩倍的錢" , 而是應該轉向矛頭, 去批判奸商把ECC賣得這麼貴, 害我買完硬碟就沒錢了
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 16:07:56兩害相權取其輕
然後ecc是1bit恢復 2bit糾錯
錯誤率太高也無能為力
我只知道奇同位跟偶同位啦
我住台中,真的遇到開7、8次槍
最好是全部的系統用ECC 是這樣沒錯
ECC是基礎功能不是高級功能 賣這麼
不過每次家裡ram壞都是直接crash,
開機不能,損失當下東西,影響不大
,公司server一定都是ecc啦
貴簡直莫名其妙 PC早就該全部換成ec
c
誰說ECC沒用,機房建置哪一個不用?
重點在服務會不會因為記憶體而停擺
無法糾錯就是導致程式出錯或系統掛B
而且我明明是針對wei在回應
沒錢就是風險去賭設備上線容錯問題
我是沒看過server能在用non ecc,也
沒人有這樣的選擇
有需求當然會納入ECC是容錯一部分
家用或家用NAS少人用不是因為價錢
而是對大部分人來說是非必要
有必要自然就會找支援ecc的設備
ecc少用就是因為 大多數人看到價錢
就會認為自己非必要
欸~ 其實也是因為一般人沒那麼容易
遇到有差的時候XD
今天收到公司買的華云AS6602T,上面
用J4125,根本不支援ECC記憶體,GG
(這台另外加裝上8G DDR4也是無法開
機)
還好我只有一隻過世的狗狗,照片都
存好丟雲端丟信箱丟臉書和備份硬碟
裡了,不怕檔案壞掉...XD
ECC沒辦法偵測所有錯誤 你剛好錯的b
it夠多剛好沒辦法偵測到的可能性還
是有的
我真得很想用 intel + ECC
不是你自己講說可以100%檢查錯誤的
嗎 還是你的100%是四捨五入的?
決鬥囉
檢查也檢查不出來啊 排列組合很難懂
?
說明一下 宇宙射線莫名其妙把你的記
憶體打亂成一秒鐘前的狀態 你也檢查
不出來是有錯誤的 機率很小沒錯但是
不是0
不過我只說這麼一次
https://youtu.be/zzeuOecdgAI
去把ECC最基本的原理搞懂再出來說話 不要在這裡浪費別人時間
講這麼多,NAS只要用Intel 的celero
n Jxxxx,Nxxxx,哪台可以支援Ecc D
DR4記憶體?核心就不支援就是不支援
,呵
世界上沒有完美的checksum 只你存在
複數合理狀態 你就存在有一種錯誤是
從一個合理狀態轉換到另外一個合理
狀態你是無法檢查的 我們工程所做的
事情就是用數學統計計算壞事發生的
機率 用合適的方式解決
對啦 你要講那種極端的例子、那種可能到人類文明滅亡那天 也不會發生一次的事情是沒錯啦 但絕對不是 "壞不夠多驗不出來"
不要自己給自己打臉好嗎= =
我記得以前學的是2bit以上都可以檢測 就算我記錯了 一個區域內要同時壞三個bit是真的很難 以現在ECC架構來說 每8byte應該就會有1byte保護 你在同一個8byte內剛好壞三個bit那是 天文數字分之一的事情
請問要怎麼檢測記憶體有Cell是壞的
是用什麼軟體嗎
memtest 之類的可以基本檢查
那你要承認一下你的錯了嗎 我是覺得
承認錯誤滿重要的啦 謙虛很重要
我沒有講錯不夠多偵測不出來啊? 1b
it是的確偵測的出來阿 可是你怎麼能
確定一個clock內只錯一個bit?
喔 那就真的是我看錯了 orz 對不起 我以為你說的是 "錯的不夠多偵測不出來" 這是真的看錯了 被那個wei115搞的很上火
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 17:14:15我從頭到尾都只有反駁你ecc能100%檢
查錯誤的點 不知道你講的是什麼?
喔喔 是誤會那就好
待會補推
補推 當然還是私心希望 w大 修一下
前面的回文 至少我沒有亂講話QQ
好 已修掉
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 17:21:57為啥有人宣傳ecc無用論Orz 現代dra
m都有incell ecc好ㄇ d5甚至expose
能scrub惹 雖然不知有沒有實作的QQ
你無視成本 一個勁的談風險 風險誰
不知道? 但問題在於說發生的次數,
是不是足以讓人承擔風險
你後面說3bit發生是天文數字 不就
代表你願意在天文數字的機率下承擔
風險?
我評估在家用場景下,ecc發生位元翻
轉並損壞資料的機率 遠小於沒有備份
造成資料損壞的機率 那裡性的選擇是
投資備份設備而不是ecc
PC用了ECC,但顯卡驅動一樣愛崩潰QQ
我原文提供這張表格 就是我當初在
評估發生機率 是否讓我願意承擔風險
很缺少的資料 所以才分享
當時只能上論壇看別人心得
有人無法接受風險 有人看看覺得還好
願意賭一把 我只是提供參考資料
重點自然還是風險大還是小的問題 你說他們搞了十幾台NAS都沒有出現過錯誤 但相反的我自己用過的PC就至少壞過三四條以上 當然 我運氣不錯 壞的當下可能就發現了 因為有引起當機 但相反的會不會有壞的沒發現的呢 RAM這種東西本來就不會說壞掉一定會引起當機 很可能要過很久之後才發現已經造成了資料毀損
其實廣義的講 ECC / filesystem 的
data checksum scrub 都是一種固定
時間內的自我檢查 以及 儲存冗餘的
除錯資料
ECC 的檢查頻率高 memory controlle
r 每次碰都檢查
scrub 就是可能定期掃
統計學上都可以處理掉一定程度的錯
誤 但是如果儲存方式沒有checksum的
話就真的要看人品了
電腦幾乎上所有的東西都有ECC 現在連L2快取都有ECC (L1有沒有就不知道) 甚至DDR5規範已經做出On-die ECC了 雖然我不知道是不是100%標配 但這說明的是其實廠商有意識到這是必要的趨勢
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 18:07:57我當初也有考慮ddr5,但看到資料說
on-die是為了應付ddr5高頻的措施,
和傳統ecc不能比,在沒有具體資料
的情況下還是選擇更便宜的ddr4
on-die DDR5 最大的問題是能不能產生HEA, 因為比起Correct, 能夠產生警報讓我能去手動修正, 這更重要。尤其是2bit以上的錯誤。 我看了很多資料, 仍然沒法確定。 至於on-die ECC 能不能跟傳統ECC比, 一部份肯定是可以的, 好比某個bit死掉, 或是被某個天外射線給翻轉了一下。
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 18:21:20所以要怎樣在不助紂為虐的情況下用
上ecc記憶體阿?
買小一點, 或真的買不起ECC, 那就買non-ECC, 但不要回過頭說 "ECC太貴、沒那麼重要" 就好-- 至少也該說 "這些天殺的廠商聯合壟斷市場, 害我們用不起ECC"
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/13/2022 19:48:12買便宜DDR5? ECC的消費級市場做大後
就可以有更多廠商競爭 拉低價格
另外還需要引起更多消費者重視吧 EC
C 不只可以防宇宙射線 還可以稍微防
護一些 rowhammer attack
想多了 這東西就是機率太低才會變成
小眾市場 沒辦法普及 如果真的機率
太高變剛需自然會變標配 真以為市場
真的都是廠商主導想幹嘛就幹嘛 市
場最後變成這樣就是代表沒啥需求
RAM都敢玩終身保固了 就代表可靠度
根本沒那麼差
我也覺得買不起就噴廠商就好,反而
鼓吹ECC無用論是本末倒置
究竟是ECC無用還是2倍價格使ECC無用
這兩個真的要分開
ECC 不會沒有用 如果你的東西一直
讀寫 那自然很有效 & 對大量資料
傳輸的正確性也會增加
這是nas 假設資料很大要保存不為過
這要看在那裡翻....很多東西都能翻
的....尤其是是長時間傳檔 這超多
情況能翻 有一些air-gap的手法
我自己測過在某些特別環境下 翻的
機率會增加數十倍到百倍
這個情況跟有些人家裡電腦就是特別
容易壞的道理有點類似
不是ECC無用
是市佔最大的Intel家用CPU根本
就不支援ECC
不要本末倒置
而且甚至不是不支援ECC 是支援ECC但故意不給你用 MC根本早就做好了
※ 編輯: wahaha99 (36.226.169.102 臺灣), 06/15/2022 07:32:22爆
[問卦] 八卦板一堆新聞的推文是發生什麼事乳提 剛剛看到一篇基輔電視塔被炸到的新聞 本來想說會看到大家會擔心消息無法外傳 到時候首都有什麼狀況沒辦法播送給民眾 結果推文真的是大開我的眼界爆
[討論] 真的是我的問題嗎?最近跟男友討論到結婚的問題 婚後勢必要跟公婆一起住 我最在意的點就是男友家的廁所 因為馬桶老舊 前一位上完廁所下一位使用者沒辦法使用爆
[討論] 政黑的都是瘋子?不,這是有原因的。剛剛在巧芯那篇推文底下,四趴非常不解為什麼政黑常見id都一直大喊「唸出來」 要上班摸魚上ptt的公務員大聲唸出留言,不管他是挺綠的還是挺蔡英文的都一樣。 有人推文了這句: : 推 patiger: 我覺得4%現在應該:政黑的都是瘋子 06/15 19:46 其實我想跟四趴講一下69
[心得] 技嘉主機板 爛透的維修品質去年12月左右購入的B550 aorus pro ac 第一次送修 2月 過年期間發現記憶體只有讀到一條 測試換別的槽來插 也拔了家人的記憶體來插 確認都讀取不到 應該是主機板的問題 開工立刻送修 修了一個多禮拜 結果取件時櫃檯說維修部門測試沒問題9
[情報] QNAP 發佈 TS-x64系列機種(464、664)我看發佈好幾天了,都沒人轉來板上XD 這次發佈的新機型 TS-464-4G:支援 4 顆硬碟,4 GB DDR4 記憶體 TS-664-4G:支援 6 顆硬碟,4 GB DDR4 記憶體7
[情報] i皇12代終全線支援ECC記憶體但要W680主版我們都知道蘇媽全系列不鎖ECC支援 以往的i皇也是有部分支援 通常在i3會支援ECC 但10代i3卻砍掉了支援X
Re: [閒聊] 為何GPU比CPU貴那麼多?做個比較試試看.... RTX 3060 VS i9-12900k 整張卡 單一顆 PCB+VRM+RAM +連接器+GPU