Re: [閒聊] 統計學

tonyookk 發表於 2023/11/28 上午1:57:51

看板BaseballXXXX標題Re: [閒聊] 統計學作者

(大珠小珠落玉盤)時間Nov 28 01:57:51 2023推噓 2 推:2 噓:0 →:1

※ 引述《alex8725 (近鉄バファローズ魂不滅)》之銘言：
: 其實這個解讀是錯的
: 正確的解讀是
: 「多次抽樣的情況下，約有95%的抽樣結果，其正負兩個標準差的信賴區間有包含
: 真值」
這個是正確的信賴區間解讀方式沒有問題
: 你問我這兩個有什麼差？我也不知道
: 但我以前老師說絕對不能這樣解讀
: 好像是因為p-hat跟p都是真值沒有機率可言吧？
這邊就稍微有點問題了，
p是一個未知母體參數所以是當成常數沒有問題。

但p_hat是p的一個估計量，也是一個統計量，
所以p_hat仍為一個隨機變數，
那既然是一個隨機變數就一定有一個機率分布，
所以信賴區間就是透過p_hat加減乘除一些東西後再造出一個統計量，
然後讓這個統計量符合某些我們已知的分布，之後再移項，
才有辦法造出統計學課本上看到的信賴區間。

那信賴區間要怎麼解讀呢？
這個問題可以參考
Introduction to Mathematical Statistics by Hogg, McKean, and Craig.
一書內所提到的解釋方式
https://imgur.com/jyBgWHC.jpg

簡單來說就是把每次抽樣、造區間都當成一次伯努力試驗，
在抽樣之前我們當然不知道抽樣後所算出來的區間到底有沒有包含p，
也就是抽樣前的區間具有隨機性，
所以在抽樣之前我們就可以說「我們抽樣前所造出來的區間包含p的機率為(1-α)」，
這邊抽樣前所造出來的區間是指統計學課本上所看到的那些公式，

就如同投擲一枚公正的硬幣，
我們在投擲硬幣前不可能知道投擲後的硬幣會出現正面還是反面，
投擲前硬幣出現的結果具有隨機性，
我們在投擲前就可以說出現正面的機率為0.5，
但一旦投擲後不是出現正面就是反面，
所以我們不會說投擲後出現正面的機率為0.5。

透過信賴區間的定義得知以上敘述是沒問題的，
即抽樣前我們造出來的區間(兩個統計量)包含p的機率為(1-α)。

這邊要注意的是我們前面提到統計量仍為一個隨機變數，
所以在抽樣之前要算機率是沒有問題的。

前面又提到我們把每次抽樣、造區間當成一次伯努力試驗，
所以重複抽樣、造區間n次可以視為服從二項分布的隨機變數，
而二項分布的期望值為 n*p (此處的p為二項分布的參數，非我們要估計的p)，
因此信賴區間可以解釋成「抽樣100次，約有 100*(1-α) 個區間包含真正的母體參數p」又或者是「我們有 (1-α)*100% 的信心說真正的p落在這個區間內」。

--
Passion Brothers
https://i.imgur.com/7idT3ui.gif

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.140.183 (臺灣)

※ PTT 網址

推

Kevin090611/28 02:11推我考試都寫最後那個

→

Kevin090611/28 02:13乾我居然半夜在複習幾年前考研的東西

推

YongBurger11/28 08:37推好專業！感覺機率的存在造就了推論統計的博大精深

同系列文章

[閒聊] 統計學