Re: [新聞] 獨家/根本在誤導判斷!數學名師嗆:遊
一些背景說明:
(1)
我沒玩過這個遊戲,
不知道遊戲合成/抽卡有無保底機制或機率隨次數遞增的機制,
還是永遠設定成 10%.
若是後者, 就是非常單純的二項分配,
當然很容易算出 300 或 175 次合成有成功多少次的次數。
但是, 很多遊戲有機率隨次數遞增的機制, 這樣就不好算了,
用模擬 (其實抽卡就是一種模擬) 配合統計推斷來判定是很合理的。
用一般方法對付簡單的特殊問題並沒有什麼過錯,
毋須糾結在此.
(2)
關於機率解釋:
(i) 抽卡人那麼多, 有人剛好很衰的機率.
(ii) 指定一個特定人物 (丁特), 他剛好很衰的機率".
這兩個是不一樣的.
(i) 機率當然比較大, (ii) 機率當然比較小,
而無論以直播情境還是對自己有利的情境, 丁特都可以根據 (ii),
當然遊戲公司可以主張 (i).
但是, 對於前者 (i), 遊戲公司也站不住腳...
我們不知道丁特抽多少次, 為簡化起見,
用遊戲公司宣稱的機率 q = 0.1 計算,
那麼, 在 (ii) 情境中, 175 中 4 次或以下的機率, 只有
\sum_{k=0}^4 {175 \choose k} q^k * (1-q)^{175-k}
這個機率大約是 7.04 * 10^{-5}, 十萬分之七,
對任何指定的人來說, 這數字很小.
然而, 假如台灣有 100 萬人 (高估) 在玩並且合成 175 次,
在 (i) 情境下, 這麼衰的人幾乎一定會出現,
(但那是不指定特定人物的情境, 和丁特的實況情境不一樣.)
另一種情況, 300 中 7 次或以下的機率, 只有
\sum_{k=0}^7 {300 \choose k} q^k * (1-q)^{300-k}
這個機率大約是 2*10^{-7},
若遊戲公司所言為真, 特定人物直播兩次, 都那麼衰的情境, 肯定不可能發生.
擴大到全遊戲玩家呢?
這裡我們簡化計算, 並對遊戲公司寬容一點,
底下的機率應該是最大的:
"假設機率為 0.1, 有 100 萬人合成 475 次, 當中有人中 11 次或以下的機率"
先說任何一個特定人那麼衰的機率是
\sum_{k=0}^11 {475 \choose k} q^k * (1-q)^{475-k} < 4.6*10^{-11}
記這個數值為 r, r 不到千億分之五, 非常小.
那麼, 全體遊戲玩家中, 至少有一個人哪麼衰的機率不超過
1 - (1 - r)^{10^6} <= 10^6 * r = 4.6*10^{-5}
這機率非常非常小.
在 (i) 的情境,
這種事情發生的可能性也不到十萬分之五,
遊戲公司根本站不住腳.
最後, 我們上面算的是
"給定虛無假設下, 這個出像或更極端情境發生的機率"
這個就是 p-value 的定義.
當然, 我們這裡沒有嚴格說明顯著水準 \alpha 是什麼,
但是無論是十萬分之七, 千萬分之二, 千億分之五, 十萬分之五,
都會低於我們通常使用的 \alpha (採嚴格標準 0.01 好了),
所以, 根據假設檢定的精神,
我們會拒絕虛無假設, 判定遊戲公司主張為假.
最後, 就這篇報導回一下.
我沒有興趣比對李祥的原始說法, 這裡僅轉述記者的報導.
※ 引述《lupin2401 (七巧寒璃)》之銘言:
: 「遊戲橘子」因紫布事件向知名實況主「丁特」提起民事訴訟,指稱丁特侵害其名譽和信用
: ,在雙方對簿公堂第2次後,數學名師「李祥」除了再次計算事件的發生機率,也接受《三
: 立新聞網》專訪,點出遊戲橘子聲稱「227次和175次是小樣本」根本在誤導判斷,直言「遊
: 戲橘子的律師數學該重修了」。
重點不是在 227 / 175 是大樣本還是小樣本,
而是這個樣本數量已經足夠我們做統計推斷.
李祥的說法不夠精確, 但他在此可能只是回應遊戲公司的辯解, 不用深究.
: 第一次直播,丁特合成紫布(《天堂M》虛擬寶物)175次僅成功4次,第二次直播則是300: 成功7次,共計475次成功11次。這樣的結果讓丁特開始質疑韓國原廠在記者會上脫口的「: 有製作、抽卡機率與台灣相同」是否屬實,不料卻遭遊戲橘子送上被告席,指稱丁特侵害: 名譽和信用。
: 事件起初,李祥老師以175次成功4次的樣本進行「假設檢定」計算,整面黑板的算式和圖: 證實10%的機率在被拒絕的區間,並寫下「有足夠證據去推論遊戲中獎機率<0.1」的結論?: 該次計算在顯著水準α=0.05的情況下,判斷系統所提供的10%的機率是否正確,以這175?: 的測試結果來說,發現無論系統提供的是10%還是5%的機率「均在拒絕區域內」,故推論?: 統標示有極高的機率是錯誤的。
以上我認為沒有問題.
先前計算是就系統提供 10% 來看,
假如合成機率是 5%, 情境 (ii) 的三種 p-value 會變成
0.05940 (特定人物某次直播合成 175 次, 只成功 4 次或更少),
0.01597 (特定人物某次直播合成 300 次, 只成功 7 次或更少),
0.00241 (特定人物某次直播合成 475 次, 只成功 11 次或更少),
只有最後一個數值會小於從嚴認定的 \alpha = 0.01.
若是遊戲公司曾公告說合成機率是 5%,
證據就沒那麼強了。
此外, 這不是太小眾的遊戲,
上面的機率都不夠小, 情境 (i) 這麼衰的人肯定會出現.
只是在丁特的例子當屬情境 (ii).
: 李祥老師強調,相對次數機率為大數法則,實驗次數越多,越能接近系統機率,雖然相關文
: 獻並沒有嚴謹的數理證明能夠判斷「多少以上為大樣本,多少以下為小樣本」,但遊戲橘子
: 卻直接指證「227次與175次是小樣本」,實乃誤導判斷。
: 無論系統機率為何種分配,根據中央極限定理,當「樣本數達到30或50以上」時,分配皆會
: 接近常態分配,則機率實驗與數學計算皆是在假設系統為常態分配下實施,李祥老師認為並
: 無不妥。
這裡不妥之處有兩點:
(1)
中央極限定理是用在抽樣的 "均值" 分配, 好習慣是把統計量說清楚.
(2) 中央極限定理並沒有說樣本達到 30 或 50 以上
這已經是積非成是. 中央極限定理只是說,
獨立抽樣的樣本越來越大, 樣本的均值分配 (經標準化後) 漸近於 (標準) 常態分配.
用簡單的模擬就可以看出, 就算 n 很大 (例如 n = 500)
就連簡單的二項分配,
https://www.youtube.com/watch?v=WYybcCXm2YE&t=1370s
實務上, 中央極限定理常常是統計推斷的判斷依據,
樣本數越少,
統計推斷越粗糙 (信賴區間越大, p-value 越大, 越不容易拒絕虛無假設),
僅此而已, 並非無法做什麼事.
"樣本數多少合宜" 並沒有一定標準,
是要看你根據什麼假設, 以及這些樣本的哪些統計量做什麼統計推斷.
而只要有抽樣, 就算很少的樣本已經可以做一些有趣的估計.
例如, 就算只從母體獨立抽 5 個樣本,
已經可以推斷:
母體的中位數, 已經有93.75% 的機率會落在這 5 個樣本的最大最小值之間.
(1 - (1/2)^5*2 = 0.9375.)
: 他直言,重點不是做過幾次實驗,而是實驗的樣本數,樣本數只要夠大,做一次就夠了,樣
: 本數很小,做多少次都一樣。
這裡也非常不妥. 李祥說的應該只是 "小樣本的均值分配" 可能很不像常態分配,
但是我前面說了, 樣本小固然很容易不像, 樣本大也可能不像,
像不像只是一種視覺標準, 實際上要看怎麼使用資料, 怎麼做統計推斷.
分三點來說:
(1) 你可以每次實驗只抽一個樣本, 樣本數已經是最小的 1 吧,
做 475 次實驗, 還是可以用中央極限定理,
因為每次實驗每次抽樣都是同樣母體的獨立抽樣.
(2) 我們前面計算合併 "175 中 4" 和 "300 中 7" 得到 "475 中 11",
其實是一種加權算法, 能這樣算大家也都覺得沒什麼不行,
實際上也是合理的, 理由同 (1).
(3) 實務上很多情境, 例如特別是醫學研究, 其樣本數很可能非常少 (常常不到20),
縱然如此, 單一研究還是可以做出一些推斷, 只要效果夠強, 可以拒絕虛無假設.
(雖然信賴區間很寬, 但足夠偏, 會讓虛無假設的值不再裡面.)
而學術社群也經常使用 meta analysis,
可以綜合一堆獨立的小樣本研究做出更強的推斷.
但這裡涉及的不只是中央極限定理,
也不只是傳統假設檢定的觀點,
例如貝氏學派就很適合做這類探討.
: 如同前段所述,雖然沒有相關文獻能明確指出大樣本和小樣本的定義,但所有的大專統計學
: 課本,甚至是國家考試的題目,皆遵循「樣本數30或50以上可視為大樣本」的原則,比起隨
: 口說說的巨大規模次數與小規模次數的主觀認定,他笑稱「遊戲橘子的律師數學該重修了」
: 。
李祥對中央極限定理的認知、以及很多統計觀念都需要修正.
: 5.完整新聞連結 (或短網址)
: https://reurl.cc/NGeL2e
: 6.備註:
: 法官知道中央極限定理嗎?
另外, 不要以為法官都是法匠,
1968年的美國法官的判例:
https://www.facebook.com/story.php?story_fbid=317036887094067&id=100063632744026這裡的邏輯和數學分析打趴大多數人。
--
吵這個沒有用 不爽不要玩
有人就是出門都會下雨
有人就是每次都踩到狗屎
你又不是麥考力 學人家課金
是錢太多逆
公佈程式碼就一翻兩瞪眼了
遊戲公司主張說有超過十萬玩家,就他哀
如何 ^.^
19
[閒聊] 抽數期望值計算機2022/12/10 11:32 更新:已排除了溢位問題,抽數設定無限大應該都可以正常運行 ----------------------寫在前面---------------------- 1. 本文含有大量數學算式,範圍涵蓋條件機率、二項式定理等數學觀念。 若對數學有強烈過敏或排斥反應,建議直接END看結論或是左轉離開。 2. 本文不含任何統計學觀念,完全只有機率。17
Re: [新聞] 席勒:美國經濟衰退機率達50% 和自我實現關於 50% 是不是跟丟銅板一樣,一半會衰退,一半不會衰退。 如果是這個意思的話,fed也不會把衰退機率放在官網上了 fed是計算未來12個月衰退的機率,不過因為金融市場有遠期利率合約14
Re: [閒聊] 期望值相同下,有天井沒天井選哪個?用點簡單的統計學概念解釋,抽卡可以視為是一個白努力試驗,成功機率為0.5%。 當然我們抽卡不會抽那麼少次,所以重複抽卡的行為就是一個二項分配。 但是二項分配會受到成功機率影響成功次數收斂到期望值的速度,意思就是假設up是0.5%成功機率的情況下你可能抽2000抽以上都不一定收歛到期望值。這個例子可以參考大丸的公主連結最開始沒有保底時的代抽實況。 保底的功用就是加速期望值收斂的過程,在維持總量不變的情況下一定是有保底對玩家的體驗才會好。 -----9
Re: [請益] 為何沒人覺得技術分析只是在腦補而已學過統計學裡面關於假設檢定的話, 應該對這樣的陳述應該有很深的印象: 在95%的信心水準下,拒絕虛無假設,接受對立假設,但仍有多少機率會犯型一或型二誤差。 這句話應該搞死很多當年唸統計的學生。 其實,技術分析就是這樣的東西,7
Re: [閒聊] 數學系請進這個反映的其實是一般人接觸條件機率的時候不太考慮條件發生機率為零的狀況 給定兩隨機變數 X,Y 我們通常在推論上使用條件機率的方式是 P(Y=y | X=x) = P(X=x, Y=y)/ P(X=x) (我已經不記得高中怎麼教的) 但這個定義在 P(X=x) = 0 是 not well-defined- : : ※ 引述《smile820226 (愛瑪小姐)》之銘言: : : 我剛剛已經跟男友吵了半小時多 : : 我覺得跟公告的機率落差過大 : : 是可以去告詐欺的
爆
[問卦] 笑死 邰智源這麼嗆喔95
[問卦] 雲端中獎號碼83
[爆卦] 中華男籃對紐西蘭首局僅拿6分74
[爆卦] 中華男籃 64 : 81 紐西蘭64
[問卦] 幹 122張發票都沒中63
[問卦] 林昱珉:小國(台灣)也能成為世界冠軍63
[問卦] CT可以改成Chinese Taiwan嗎?爆
[問卦] 誰來蹭冠軍讓你最反感?42
[問卦] 有台女在北車開放做愛40
[問卦] 中國有14億人居然打不進12強38
[問卦] 幹你娘為什麼雲端發票又沒中???29
[問卦] 編程用到遞迴是不是很多人不能接受33
[問卦] 跑去日本人YT留言謝謝日本的啥心態?32
Re: [新聞] 洪申翰僅高中畢業接勞動部長 藍營怒批:爆
[問卦] 日本體育報 頭版24
[問卦] 中華隊已經是最大公約數了吧95
[問卦] 今天發票對獎欸,大家五期待否…19
[問卦] 我中獎了!!!!23
[問卦] 8年級拿的出1千萬出來的人多嗎?20
[問卦] 郭泓志怎麼不當教練 跑去演藝圈22
[問卦] 為啥?發票越來越難中獎!16
[爆卦] 中華隊輸了17
[問卦] 我中獎惹9-10月統一發票37
[問卦] 蝦皮店到店最近也開太兇?☺36
[問卦] 明天鏡週刊新連載 大家覺得有什麼新劇本18
[問卦] F-16V放熱焰彈迎棒球英雄回國?20
[問卦] 台灣被騙金額超過1000億 政府沒認真打詐19
[問卦] 中國台北 32 : 37 紐西蘭 進入下半場?20
[問卦] 為何很多人不推薦買D-Link的路由器?21
[問卦] 戶郷翔征第5局被打出全壘打時在想什麼