PTT評價

Re: [閒聊] 統計學

看板BaseballXXXX標題Re: [閒聊] 統計學 作者
tonyookk
(大珠小珠落玉盤)
時間推噓 2 推:2 噓:0 →:1

※ 引述《alex8725 (近鉄バファローズ魂不滅)》之銘言:
: 其實這個解讀是錯的
: 正確的解讀是
: 「多次抽樣的情況下,約有95%的抽樣結果,其正負兩個標準差的信賴區間有包含
: 真值」
這個是正確的信賴區間解讀方式沒有問題
: 你問我這兩個有什麼差?我也不知道
: 但我以前老師說絕對不能這樣解讀
: 好像是因為p-hat跟p都是真值沒有機率可言吧?
這邊就稍微有點問題了,
p是一個未知母體參數所以是當成常數沒有問題。

但p_hat是p的一個估計量,也是一個統計量,
所以p_hat仍為一個隨機變數,
那既然是一個隨機變數就一定有一個機率分布,
所以信賴區間就是透過p_hat加減乘除一些東西後再造出一個統計量,
然後讓這個統計量符合某些我們已知的分布,之後再移項,
才有辦法造出統計學課本上看到的信賴區間。

那信賴區間要怎麼解讀呢?
這個問題可以參考
Introduction to Mathematical Statistics by Hogg, McKean, and Craig.
一書內所提到的解釋方式
https://imgur.com/jyBgWHC.jpg


簡單來說就是把每次抽樣、造區間都當成一次伯努力試驗,
抽樣之前我們當然不知道抽樣後所算出來的區間到底有沒有包含p,
也就是抽樣前的區間具有隨機性,
所以在抽樣之前我們就可以說「我們抽樣前所造出來的區間包含p的機率為(1-α)」,
這邊抽樣前所造出來的區間是指統計學課本上所看到的那些公式,

就如同投擲一枚公正的硬幣,
我們在投擲硬幣前不可能知道投擲後的硬幣會出現正面還是反面,
投擲前硬幣出現的結果具有隨機性,
我們在投擲前就可以說出現正面的機率為0.5,
但一旦投擲後不是出現正面就是反面,
所以我們不會說投擲後出現正面的機率為0.5。

透過信賴區間的定義得知以上敘述是沒問題的,
抽樣前我們造出來的區間(兩個統計量)包含p的機率為(1-α)。

這邊要注意的是我們前面提到統計量仍為一個隨機變數,
所以在抽樣之前要算機率是沒有問題的。

前面又提到我們把每次抽樣、造區間當成一次伯努力試驗,
所以重複抽樣、造區間n次可以視為服從二項分布的隨機變數,
而二項分布的期望值為 n*p (此處的p為二項分布的參數,非我們要估計的p),
因此信賴區間可以解釋成「抽樣100次,約有 100*(1-α) 個區間包含真正的母體參數p」又或者是「我們有 (1-α)*100% 的信心說真正的p落在這個區間內」。

--
Passion Brothers
https://i.imgur.com/7idT3ui.gif


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.140.183 (臺灣)
PTT 網址

Kevin090611/28 02:11推 我考試都寫最後那個

Kevin090611/28 02:13乾我居然半夜在複習幾年前考研的東西

YongBurger11/28 08:37推 好專業!感覺機率的存在造就了推論統計的博大精深