PTT評價

Re: [閒聊] 機率與統計

看板C_Chat標題Re: [閒聊] 機率與統計作者
assss49
(帥為)
時間推噓15 推:15 噓:0 →:48

※ 引述《iampig951753 (李白)》之銘言:
: 其實他說的完全沒錯
: 公正硬幣來說
: 是有可能出現十次正或是十次反的
: 機率差不多千分之一
: 機率這種東西樣本越大
: 越接近原本估算的百分比
: 所以才會有所謂的信賴區間
: 你做一千次去計算實際機率
: 可能不會是千分之一
: 但是丟一億次
: 實際機率肯定會非常非常貼近千分之一
: 只要假設機率是對的
: 意思就是說 當你實驗的次數越多
: 機率只會往準確的時候部分修正
: 因為事件總會發生
: 不可能永遠都沒發生
: 所以樣本每增加一個
: 碰到事件的可能也會增加
: 夜路走多了會碰到鬼這句話
: 就是在講述機率的真理
: 機率不是靠賽 是科學
: 不要以為1%就只是1%
: 當你打算做一萬次
: 對你來說發生一次的可能性早就不是1%了
: 之前我就有提過了 獨立事件的誤區
: 就是忘記把機率加起來算
: 如果有個實驗只有1%會死
: 你做300次還活著就給你一億
: 跟另一個實驗50%會死但是做一次沒死就給一億
: 你選哪一個?
: 獨立機率的謬論支持者的邏輯來說
: 他應該選1%的
: 因為1%小於50% 每次都是獨立的 懂?
: 這次1%下次當然也是1%
: 那鬼才選死亡率大50倍的
: 笑死 幼稚園白讀


你的敘述讓人聽起來就像是:

「有一個神秘的科學神明,當有人連續躑硬幣10次都出現正面,他就會改變硬幣的結構、重力場等等,讓硬幣出現的反面的機率上升,直到硬幣正反面出現的機率會歸到1/2。」

我希望你是敘述能力欠佳所以表達有點偏誤,

所謂的大數法則、做無窮次的試驗機率會回歸,

這背後的原因也是因為你做得試驗越多,

根據統計結果「預估的機率p」

接近「真實機率P」的機率也會越高,
(而事實上大部分的問題我們並不知道真實機率P是多少)

而所謂的95%信賴區間,

意思是這個測驗中「真實機率P」有95%的機率會落在這個區間內,

當樣本數提高 變異數 s^2 = p*q/n 則會降低,
(架設抽樣至常態母體的話)

其中p=預估的機率 、 q=1-p

所以信賴區間會越來越窄,

而lim(n-> infinity)s ^2 =0 ,

所以當lim(n-> infinity)信賴區間的上界等於下界,

才會有你所謂的「回歸」的現象發生,
(大數法則不嚴謹的解釋)

而不是什麼超自然的科學神明,

高中的數學就可以解答了。



但必須說實務上很多事件其實是相依事件,甚至很多時候預估就有bias…
(即便是電腦抽卡也是,記憶體之間會互相影響,時間種子等等因素也會影響機率)

不過為了處理上方便還是假設為獨立事件,而且大部分的系統宏觀上來看也可以以獨
立事件來分析,但微觀或是小樣本的時候會有很大的偏誤。這其中可以牽涉到數理統計、測度、甚至泛函,我也是懵懵懂懂。


乾一直打錯字,編輯好多次。
--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.233.202 (臺灣)
PTT 網址

k96060808/01 15:13神無論如何都會把世界修正成1%的樣子

※ 編輯: assss49 (123.192.233.202 臺灣), 08/01/2022 15:18:12

storyo1141308/01 15:17當你不是天選之人,你抽到的樣本最終會回歸大眾

storyo1141308/01 15:19不管你是首抽中獎還是開局百抽百敗的例子

※ 編輯: assss49 (123.192.233.202 臺灣), 08/01/2022 15:19:29

XFarter08/01 15:24其實你認真看原原 Po 的敘述,我是覺得他已經拿很直觀的

XFarter08/01 15:24比喻來解釋統計機率跟古典機率的差異了。

XFarter08/01 15:24無奈的是要拿一個大眾能聽懂的陳述「統計機率的性質」這

XFarter08/01 15:24件事,其實我覺得沒這麼容易XD

※ 編輯: assss49 (123.192.233.202 臺灣), 08/01/2022 15:28:00

arrenwu08/01 15:27樓上不妨用數學語言發篇文章? 希洽這裡理工背景的很多啊

arrenwu08/01 15:27就算沒有很多 也不至於沒一個人看得懂吧

XFarter08/01 15:28無奈的是我統計機率沒有強到自認能不做功課發文== 只敢推

XFarter08/01 15:28文發表看法XD

我也是憑記憶在寫,超怕寫錯QQ 不過概念應該差不多是醬。

smart0eddie08/01 15:28這人就釣魚的 不用認真理他

※ 編輯: assss49 (123.192.233.202 臺灣), 08/01/2022 15:30:18

shifa08/01 15:301%跟50%的實驗那個不算是純然的機率問題,而是有期望值考

shifa08/01 15:30量的選擇問題。

arrenwu08/01 15:30如果你沒辦法用數學語言描述 那你怎麼確信你知道他在講

arrenwu08/01 15:30什麼?

XFarter08/01 15:33但我認知中原原 Po 的文意是想講那三百次「實驗」的 1%

XFarter08/01 15:33的表定理想機率,在後面次數的「實驗」並不能保證能跟第

XFarter08/01 15:33一次的「實驗」一樣公正,可能更高也可能更低,假使有「

XFarter08/01 15:33類似累計誤差的偏誤」的機制存在,在 worse case 的情況

XFarter08/01 15:33下,在最後幾次實驗失敗的統計機率,反而比只能做一次 50

XFarter08/01 15:33% 的實驗還高。

其實實驗不公正就很難討論了,要用統計來討論問題就是因為不可控制的變量太多,這些 變量互相干擾綜合的結果就會趨近於統計的結果,但確實有的領域是在研究偽隨機,確實 會有你敘述的狀況發生(而且現實中其實也沒有真正的隨機)這個水就很深了。

arrenwu08/01 15:35如果實驗不公正,那又怎麼知道下一次實驗結果的機率?

XFarter08/01 15:35@arrenwu 我是從原原 Po 強調「走多夜路碰到鬼」以及很強

XFarter08/01 15:35調「實驗」的句子認文意的啦,不然要寫符號還要檢查到不

XFarter08/01 15:35被噓真的很累...QQ

uranus01308/01 15:38夏蟲不可語冰 並不是能力不足 而是他的世界真的長這樣

uranus01308/01 15:39我是覺得到此為止就好

lazarus112108/01 15:39用數學的語言就是引入極限的概念吧

shifa08/01 15:40其實這篇就講出來點來了。但是人對於機率的直覺往往會導致

shifa08/01 15:40誤判。恐怖的是對機率的誤判往往會有一套看似完整的邏輯。

LLuthor08/01 15:40回到芽依的問題,她10次反面,之後會有比較多的正面。這

shifa08/01 15:40單純的機率常常很反直覺…

LLuthor08/01 15:40是她以為她是95%的凡人,但是他沒想到,他可能是2.5%的地

LLuthor08/01 15:40獄倒霉鬼。

LLuthor08/01 15:40一般來說,擲20次硬幣會有很多出現在10的附近,但是也會

LLuthor08/01 15:40有全是反面的機率存在。只是這個可能性很低就是了。

※ 編輯: assss49 (123.192.233.202 臺灣), 08/01/2022 15:45:01

lazarus112108/01 15:41只要扯到極限,高中以前學的東西都要丟掉了

看到你提到極限,馬上想起來忘記寫~

LLuthor08/01 15:42其實機率有個很基本但重要的定律,叫做貝式定理。一般人

LLuthor08/01 15:42常常就是條件機率跟一般的機率搞混。

smart0eddie08/01 15:43芽衣純粹智障

guogu08/01 15:43攻殺小 機率不公正我們就什麼屁都不用討論了

smart0eddie08/01 15:44而且就算她搞懂硬幣機率

smart0eddie08/01 15:44她FX照樣會輸到下海

※ 編輯: assss49 (123.192.233.202 臺灣), 08/01/2022 15:51:49

lazarus112108/01 15:47有限的例子討論無限的理論,可以直接略過了

Gjerry08/01 15:50看你是 Frequentism 還是 Bayesian statistics 的角度看

Gjerry08/01 15:50事情。前者會說出現這樣的情形是因為試驗做得不夠多,後

Gjerry08/01 15:50者會說硬幣不是公平硬幣。

XFarter08/01 15:53推樓上

guogu08/01 15:55那個i莎咪挖溝的文章一開頭就說是公正硬幣了==

guogu08/01 15:57而且你當硬幣不公正 更應該去壓正面而不是反面

cybermeow08/01 16:00硬幣不公正當然是算posterior做posterior sampling啊

XFarter08/01 16:02有 我剛剛認真再看一遍硬幣公正的那段論述 為什麼機率會

XFarter08/01 16:02變成千分之一== 補噓ㄌ

Gjerry08/01 16:03另外連續的擲硬幣 frequentism 會用 geometric distribut

Gjerry08/01 16:03ion (幾何分佈) 來描述整個試驗,geometric distribution

Gjerry08/01 16:03 是 memoryless (無記憶性) 的也就是某事件發生與等待時

Gjerry08/01 16:03間無關。

xxxg00w008/01 16:05ㄟ幹 不是 現在不是暑假嗎?還好我碩士畢業多年了XD

xxxg00w008/01 16:06一瞬間發現自己疑似走錯版

Gjerry08/01 16:06如果相信是要用貝氏機率解釋,不斷地觀測到某一個事件發

Gjerry08/01 16:06生,會對下一次發生該事件的信心提升,確實應該壓正面而

Gjerry08/01 16:06不是反面。