PTT評價

Re: [問卦] 統計誤差範圍怎麼算

看板Gossiping標題Re: [問卦] 統計誤差範圍怎麼算作者
hawick
(刺蝟哲學)
時間推噓 4 推:6 噓:2 →:33

※ 引述《pledge1060 (再落就沒葉了XD)》之銘言:
: 小弟非統計專業 只是個工程師
: 想法比較單純 可以做實驗得到的數據就可以說服自己
: 先說結論,兩種算法都不對,工程上估算時為誤差值平方和開根號
: 即ex: A=50%+-3%;B=55%+-3%時
: B-A=5 +- (3^2+3^2)^0.5 = 5%+-4.24%
: 驗證很簡單,有excel就可以做
: 利用excel常態分佈函數NORMINV輸入A跟B標準差跟平均值
: 再把B-A得到C
: 將數列下拉得到C的數列
: 這時再使用Excel內建的平均值(AVERAGE)與標準差(STDEV.S)公式
: 算出C數列標準差與平均值
: 只要C數列數量夠多你可以得到C數列標準差為A,B標準差之平方和,也就是~+-4.24%
: 而所謂95%信心程度即2倍標準差,套用公式後仍可成立
: 也就是C的2倍標準差為A與B的2倍標準差的平方和
: 回到6題民調 每題都有各自己的A,B的2倍標準差值2.17%~2.98%不等
: 套用到公式後B-A的2倍標準差為3%~4.2%不等
: 以6家民調來說就算取最大值4.2%,仍然是3比3平手
: 以上為工程上經驗與Excel測試的分享
: 若有例外情形也請不吝指教
感謝回覆,我也分享一下例外情形
原始公式長這個樣子
https://imgur.com/fv56Oyc
因為聯合變異數cov只有在X&Y不相關才可以視為零

所以考慮極端狀況X&Y完全負相關
可以看以下這篇
https://pansci.asia/archives/80486
假設var(X)=Var(Y)=3%^2 則cov(X,Y)=-3%^2
Var(X-Y)=4*3%^2 開根號得Std=2*3%=6%
也就是說統計誤差6%是對的

另一個極端狀況X&Y完全正相關
則Cov(X,Y)=+3%^2
Var(X-Y)=0 Std=0
也就是說統計誤差=0

所以說依據X&Y相關性差異
統計誤差從0~6%都是可能的
因為相關性沒有公開數據
所以朱跟費兩個人的說法都落在統計誤差的可能範圍
我也非統計專業,不知道有沒有算錯

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.227.163.177 (臺灣)
PTT 網址

cs09312 11/19 13:55泛科學 XD

jayppt 11/19 13:57你在講什麼?誤差就是正負3 怎麼都不會變6

PTTpeter 11/19 13:57講了一堆,沒一句看得懂

jayppt 11/19 13:57誤差最大到正3 最小到負3 沒相加的意義

citycode 11/19 14:00不要讓了,選總統還要讓,丟臉

TZULIU 11/19 14:01錯了

killfox123 11/19 14:03把正負3的範圍的數字,再拿出來正負一

killfox123 11/19 14:03次是多少了

cvnn 11/19 14:09只有一次 +3%內的誤差 or -3%內的誤差 不會

cvnn 11/19 14:09同時存在兩次誤差

vdrenike 11/19 14:21讓2次才會變6%,問題是差到6%根本沒有

vdrenike 11/19 14:21代表性,你跟人說我輸6%其實沒輸?

ImBBCALL 11/19 14:22笑死 測出的數值就在那邊

ImBBCALL 11/19 14:23算一次誤差就夠扯了 還算兩次

illreal 11/19 14:31誤差傳遞啊當然要算兩次

PRME 11/19 14:35變異數和n有關啦

blueline19 11/19 14:36還在混淆,講6%就是最直接的說法,事

blueline19 11/19 14:37實上是你拿落後的上限去比領先的下限

blueline19 11/19 14:37,有道理嗎?如果有AB產品標準是100

blueline19 11/19 14:37公克和94克,各有誤差正負3公克,單

blueline19 11/19 14:37純比較每個人拿到這個A產品,每個人

blueline19 11/19 14:37拿到的A產品有誤差容許,可能有人能

blueline19 11/19 14:37拿到103上限或97下限。但是你如果把B

blueline19 11/19 14:37產品拿來跟A比較,你說A產品我是拿到9

blueline19 11/19 14:387克,但是B產品我拿到上限97克,然後

blueline19 11/19 14:38你就說B產品跟A產品一樣好?一百次隨

blueline19 11/19 14:38機抽樣A和B比較都會是這個結果?再來

blueline19 11/19 14:38說應該要先B產品的克數確定了再來將A

blueline19 11/19 14:38的誤差扣掉去比較B才合理吧?

laiobart 11/19 14:44統計就是每1068分民調中每個人有正負3%

laiobart 11/19 14:44的誤差值95%信心水準下,如果侯的民調

laiobart 11/19 14:44是20%那這份資料中侯的民調就是在17-23

laiobart 11/19 14:44%之間,而柯假設25%,其民調就是在22-2

laiobart 11/19 14:443%之間,所以差距6%是取侯的極大值跟柯

laiobart 11/19 14:44的極小值下去做比較,合不合理就大家自

laiobart 11/19 14:44己判斷了

laiobart 11/19 14:45寫錯22-28%之間

我有寫了極端狀況6%是完全負相關,你舉的例子是高度正相關或不相關,兩者沒有可比性 既然沒有提供相關性的資訊,所以有必要考慮極端狀況

※ 編輯: hawick (61.227.163.177 臺灣), 11/19/2023 15:01:41

kiou 11/19 15:35你怎麼不舉反的極端 還扯相關 怕別人不知道

kiou 11/19 15:37你有懂11樓講的抽樣結果的代表性嗎

mikezip 11/19 15:44反而這篇看得懂