PTT評價

Re: [問卦] 為什麼統計誤差一率是 3 趴?

看板Gossiping標題Re: [問卦] 為什麼統計誤差一率是 3 趴?作者
newwu
(說不定我一生涓滴廢文)
時間推噓14 推:16 噓:2 →:63

※ 引述《ronny1020 (偷偷魯蛇)》之銘言:
: 統計誤差不是要看樣本數決定嗎?
因為樣本數大家都差不多一千上下,而且大家信心水準都選95%
: 還有信賴區間什麼?
: 而且為什麼會每份統計都一樣?
: 這神秘數字 3 趴是怎麼用科學方式算出來的?
: 有統計學大師能幫忙解惑嗎?

比起這個,我比較好奇所謂的在誤差範圍內是什麼意思
有些一知半解的人會說
因為兩個各3% 所以加起來6%
這太不合統計學

因為假設無相關,誤差應該是平方相加開根號
也就是一組要比另一組好4.2% 才能確保差值的信賴區間不包含0

但是這狀況很明顯不是無相關性的,
因為overlap很大,所以考慮相關性,差值的信賴區間甚至可以比3%小吧
而且假如一份問卷同時問兩個情形,絕對能考量相關性的吧

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 94.140.8.203 (美國)
PTT 網址

Loda29 11/16 06:43好了啦,深綠X粉廢票網軍

banmi 11/16 06:43那個是用常態分佈去算的,95%的信心水準,算

banmi 11/16 06:44出來是1.96個標準差,一般會用兩個標準差算

banmi 11/16 06:45標準差的公式是√p(1-p)/2

banmi 11/16 06:45打錯了,是√p(1-p)/n

newwu 11/16 06:46我知道 我現在問題又不是這個

banmi 11/16 06:46google"常態分佈 95% 信心水準"很容易找到

banmi 11/16 06:47sorry,那就誤會你的問題了.... :)

newwu 11/16 06:47原原po問題很簡單 √(0.5^2/1000)*2 ~0.03

newwu 11/16 06:48這我知道,我只是好奇他們要比較結果是不是

newwu 11/16 06:48在誤差範圍內要怎麼算

banmi 11/16 06:49我倒是比較好奇,為什麼p都用0.5下去算. = =

newwu 11/16 06:49通常這是說AB兩組有沒有統計顯著差異

newwu 11/16 06:50但是這就是有我上面那個相關性的問題

StylishTrade 11/16 06:52操弄問題造成的誤差更大好嗎

StylishTrade 11/16 06:53這個3%只是統計誤差 不包含系統誤差

StylishTrade 11/16 06:54你把統計誤差弄成零也沒用

garry5566 11/16 06:54沒差,相關性再大不會超過1

StylishTrade 11/16 06:54單單機構效應 就不知道幾%了

newwu 11/16 06:55這又沒辦法避免,單以統計誤差來說,他們的

newwu 11/16 06:55規則訂得蠻不明確的吧

garry5566 11/16 06:56在未知母體下,p=1/2 算出來的n最大,

StylishTrade 11/16 06:56因為猴子不敢賭 你不讓3% 他不會上

garry5566 11/16 06:56以確保能達到95%信賴區間

StylishTrade 11/16 06:56

wolver 11/16 06:57以前數學老師沒教嗎?公式背起來就對了,不

wolver 11/16 06:57要問為什麼.

StylishTrade 11/16 06:57釣猴子釣到大白鯊 QQ

newwu 11/16 06:57所以他們的規則是直接讓3%不考慮統計細節嗎

garry5566 11/16 06:58你套公式就可以用相關係數=1算你需要

garry5566 11/16 06:58的最大的誤差值

garry5566 11/16 06:59有“民調專家“,應該不會簡單用3%去

garry5566 11/16 06:59判斷

newwu 11/16 07:00重點是假如民調專家考慮相關性,其實對柯很

newwu 11/16 07:02有利,因為是差值 所以差值誤差範圍是

newwu 11/16 07:033%*sqrt(2*(1-rho^2)),因為兩組overlap高

garry5566 11/16 07:03算了一下,相關係數去取最大值1, 標準

garry5566 11/16 07:04差是6%

newwu 11/16 07:04差值的信賴區間可以比正負3%還要小

garry5566 11/16 07:08V(p1-p2)=V1+V2+2r*S1*S2)=< 4*V1

newwu 11/16 07:14因為是相減 所以相關性前面要是負號,所以

newwu 11/16 07:15重點不是<4V1 而是有機會<V1

garry5566 11/16 07:15你是不是套錯公式?相關型越大,需要

garry5566 11/16 07:15的誤差值越大,對柯p約不利

garry5566 11/16 07:16沒有喔,不管相加還是想減,共變異數

garry5566 11/16 07:17前面都是加號

garry5566 11/16 07:19var 是平方和,所以不會出現減號

patiger 11/16 07:19因為p不可能為0這樣統計個屁

newwu 11/16 07:19你誤解相關性了吧 這裡的相關性是指,以抽

newwu 11/16 07:20樣1000唯一次民調來說,假如有一組(1000

newwu 11/16 07:20個民眾)的侯柯比例越高,那組的柯侯比例也

newwu 11/16 07:20會越高,這是一定的

newwu 11/16 07:21並不會出現負號啊 最小的狀況就是0

garry5566 11/16 07:22你要做 p1-p2=0的假設檢定, 用的標準

garry5566 11/16 07:22差就是v(1-2)

patiger 11/16 07:24常態分布的模型分布是負無窮到正無窮,

patiger 11/16 07:24不取一定範圍根本無法估算,95%信心區間

patiger 11/16 07:24大概是2倍標準誤差範圍內,再擴大上去效

patiger 11/16 07:24益很低

newwu 11/16 07:24你才搞錯 想想a=b的狀況,Var(a-b)是0,var

newwu 11/16 07:24(a+b)=4 Var(a)

newwu 11/16 07:37換個方向想你設p2’=-p2 r’=-r 所以加減

newwu 11/16 07:37當然會變號

garry5566 11/16 07:38https://i.imgur.com/aDBGjBB.jpg

garry5566 11/16 07:40除非rho=-1, 你才會看到減號

garry5566 11/16 07:41剩下的你去翻書吧, 我要工作了

newwu 11/16 07:41問題是X和Y在這裡就是正相關啊

newwu 11/16 07:43你打叉那項就是一個負的contribution 也就

garry5566 11/16 07:43所以不會有減號啊

newwu 11/16 07:43是說Var(X-Y)在這裡小於Var(X)+Var(Y)

newwu 11/16 07:44Var(X-Y)當然不是負的,重點是它可能比Var(

newwu 11/16 07:45X)小

zephyr105 11/16 07:45谷歌 區間估計…

newwu 11/16 07:46懂嗎 所以考量相關性,差值的信賴區間可能

newwu 11/16 07:46小於3%

k44754 11/16 07:48統計學可以做手腳的

garry5566 11/16 07:48我晚點再來查查是不是我記錯

AddListener 11/16 07:56https://reurl.cc/jvj1kZ

chenu 11/16 08:18問統計數字是我們DPP強項 柯批這次G了

yudofu 11/16 08:58信心多大,誤差就有多大

PRME 11/16 10:47相關性有證明題,很長,沒人想看