Re: [閒聊] 統計學
※ 引述《alex8725 (近鉄バファローズ魂不滅)》之銘言:
: 其實這個解讀是錯的
: 正確的解讀是
: 「多次抽樣的情況下,約有95%的抽樣結果,其正負兩個標準差的信賴區間有包含
: 真值」
這個是正確的信賴區間解讀方式沒有問題
: 你問我這兩個有什麼差?我也不知道
: 但我以前老師說絕對不能這樣解讀
: 好像是因為p-hat跟p都是真值沒有機率可言吧?
這邊就稍微有點問題了,
p是一個未知母體參數所以是當成常數沒有問題。
但p_hat是p的一個估計量,也是一個統計量,
所以p_hat仍為一個隨機變數,
那既然是一個隨機變數就一定有一個機率分布,
所以信賴區間就是透過p_hat加減乘除一些東西後再造出一個統計量,
然後讓這個統計量符合某些我們已知的分布,之後再移項,
才有辦法造出統計學課本上看到的信賴區間。
那信賴區間要怎麼解讀呢?
這個問題可以參考
Introduction to Mathematical Statistics by Hogg, McKean, and Craig.
一書內所提到的解釋方式
https://imgur.com/jyBgWHC.jpg
簡單來說就是把每次抽樣、造區間都當成一次伯努力試驗,
在抽樣之前我們當然不知道抽樣後所算出來的區間到底有沒有包含p,
也就是抽樣前的區間具有隨機性,
所以在抽樣之前我們就可以說「我們抽樣前所造出來的區間包含p的機率為(1-α)」,
這邊抽樣前所造出來的區間是指統計學課本上所看到的那些公式,
就如同投擲一枚公正的硬幣,
我們在投擲硬幣前不可能知道投擲後的硬幣會出現正面還是反面,
投擲前硬幣出現的結果具有隨機性,
我們在投擲前就可以說出現正面的機率為0.5,
但一旦投擲後不是出現正面就是反面,
所以我們不會說投擲後出現正面的機率為0.5。
透過信賴區間的定義得知以上敘述是沒問題的,
即抽樣前我們造出來的區間(兩個統計量)包含p的機率為(1-α)。
這邊要注意的是我們前面提到統計量仍為一個隨機變數,
所以在抽樣之前要算機率是沒有問題的。
前面又提到我們把每次抽樣、造區間當成一次伯努力試驗,
所以重複抽樣、造區間n次可以視為服從二項分布的隨機變數,
而二項分布的期望值為 n*p (此處的p為二項分布的參數,非我們要估計的p),
因此信賴區間可以解釋成「抽樣100次,約有 100*(1-α) 個區間包含真正的母體參數p」又或者是「我們有 (1-α)*100% 的信心說真正的p落在這個區間內」。
--
Passion Brothers
https://i.imgur.com/7idT3ui.gif
--
推 我考試都寫最後那個
乾我居然半夜在複習幾年前考研的東西
推 好專業!感覺機率的存在造就了推論統計的博大精深
爆
[爆卦] 民調計算全詳解--------------------更新一下結論啦---------------------- 有推文說兩種問題是分開的,一個受訪者只會被問一個問題,所以把這種情況的結果也更 新一下: 柯侯對賴其中一項民調變不顯著:63
[爆卦] 科普一下可以吧...那個老師教的統計誤差科普一下統計的區間估計 一般來說區間估計都會有一個信心水準 意思是母體真值落在這個區間的信心 (不是機率...因為信賴區間是「事後」的概念,因為是已經抽樣完了...不過在這裡不影 響理解)39
[討論] 如果是你,要如何跟館長解釋統計學?如果是你, 要如何跟館長解釋統計學, 要白話,要淺顯易懂, 比如說下面幾個名詞 母體18
[討論] 咱來嘮一嘮真正的統計學 讓你對愚蠢免疫讓我來說一下真正的統計學 不知 母數 信賴區間率 不知 正負 3% 其實是 上下3% 你只會越看越茫 被名嘴政客感染愚蠢 民調就是去探測真正的支持度(母數)6
Re: [問卦] 台清交統計學權威教授不要再躲了統計就是參數未知,由抽樣的樣本去推估 參數就是最後真正的得票率等等 真正的參數就只有上帝才知道答案 比如侯柯配的真用得票率,只有上帝知道, 我們不是上帝,只能用有限樣本去推估15
Re: [閒聊] 機率與統計你的敘述讓人聽起來就像是: 「有一個神秘的科學神明,當有人連續躑硬幣10次都出現正面,他就會改變硬幣的結構、 重力場等等,讓硬幣出現的反面的機率上升,直到硬幣正反面出現的機率會歸到1/2。」 我希望你是敘述能力欠佳所以表達有點偏誤, 所謂的大數法則、做無窮次的試驗機率會回歸,7
Re: [問卦] 認真問3% 6%哪來的大家好, 小弟文組剛剛看喉科回來, 機率,信心水準,誤差界線真的沒很難,我阿罵都會。 樣本從推論母體, 譬如普查柯文哲支持率 θ4
[討論] 如果做中職人氣王民調如果中職做電話民調 全台做1000人抽樣統計 賴鴻誠一定是人氣王 因為信賴區間 ------ 大家好, 小弟翻開 抽樣方法第二版,黃文龍著, 誤差界線 B,信心水準1-alpha,有以下關係, P(|估計值-母體參數|<B)=1-alpha 所以誤差的意思,
59
[閒聊] 味全合約條件還是相較有利56
[分享] 黃培閎 我反對刪除潛艦預算11
[閒聊] 中南部人連新竹天氣都受不了了10
[閒聊] 今天會有消息嗎?64
[討論] 不能理解有原跟上澤被酸欸4
[閒聊] 統一隊終極目標17
[閒聊] 對岸廢片的產量怎麼那麼驚人?3
[閒聊] 今天好冷2
[閒聊] 前日職名將:應該要「剝奪冠軍獎金」10
[閒聊] 阿金進來4
[分享] 球速130的人真的不少6
[閒聊] 棒球員做重量訓練12
[閒聊] 台鋼有在看 60人外 有經驗的投手1
[閒聊] 東體對上澤的新說法1
[開戰] ㄋㄥˇ就算了7
[討論] 其實上澤就是不敢回火腿吧1
[閒聊] U19橄欖球7
[閒聊] 腿迷是日職最溫和的球迷17
[大師] 原來上澤還有用火腿設備訓練這段喔2
[閒聊] 以前都只能在國外看 XXX人生1
[閒聊] 職棒雜誌513海報2
[閒聊] 軟銀是日職曼城嗎?