Re: [問卦] 有沒有三方的統計學都超級爛的八卦

brian900530 發表於 2023/11/19 上午6:54:22

看板Gossiping標題Re: [問卦] 有沒有三方的統計學都超級爛的八卦作者

(LmWAng9)時間Nov 19 06:54:22 2023推噓31 推:34 噓:3 →:96

首先抽樣誤差是在統計學上本來就會有的限制

只是用機率的形式來展現

拿抽樣誤差3%6%來說要讓幾% 根本就在亂用

到底指的是民調數字讓3%？讓抽樣誤差？

還是只要沒有統計上的顯著差異就讓？

講的不清不楚

更別說兩黨在比的東西不一樣吵的東西也不一樣

一邊比差距的差距，一邊比柯侯-侯柯

一個是相對數字一個是絕對數字

兩邊所謂的3%6%指的根本就不是同一件事

到底在吵什麼，也完全是看不懂

假設有效樣本數1068 在95%信心水準下

誤差就是+-3%，舉例來說就是100的正負3

但這只能用在計算單一統計值的時候

藍白是把一個民調裡面的兩個統計值拿來相比

下面就直接節錄一些臉書上教授寫的文

支持率的差異不一定要超過兩倍的抽樣誤差（柯文哲說的6%）才會達到統計顯著

第一因為3%是保守最大值的估計，實際上的「抽樣誤差」通常會比3%小。

再者信賴區間有重疊也不代表沒有達到統計顯著

第二，兩個人的對比支持率是同一個民調做出來的，不是獨立樣本，不能忽略相關性。

———————————————————————

以下是同一民調不同問題得出的支持度應該怎麼比較:

https://i.imgur.com/4sM2ya6.jpg

以匯流為例，樣本數n = 2046，(1) 柯侯48.3%對比(2)賴蕭 39.2%，所以(1)-(2) = (3)

兩個統計量的差異的標準誤差是這樣算的 https://i.imgur.com/50DV1iY.jpg

sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )

=

sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)

= 0.021

因為柯侯: 賴蕭是在同一個問題問的，支持柯侯就不會支持賴蕭 (互斥)

所以這兩個支持率的相關性是負數，這就是為什麼公式後面為什麼會多出2*p1*p2。

所以柯侯對比賴蕭的支持率要超過1.96*2.1% = 4.1%，才有統計上的差異。

同樣的方式可以算出(4)-(5)=(6)，兩個統計量的差距的標準誤差是0.0207。

所以侯柯對比賴蕭的支持率也是超過1.96*2.07% = 4.1%，才有統計上的差異。

但是如果要直接比較柯侯對侯柯的支持度，就得考量到這是兩個不同問題得到的

而且支持柯侯的人也會比較傾向侯柯，所以相關性為正。

而(1)-(4)的標準誤差會長得像這樣

sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )

=

sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)

= ???

v 是柯侯跟侯柯在兩個問題的共變異數，得用原始資料去估計。

沒有v就算不下去

也就是說，不論是(3)-(6)=(7)還是(1)-(4)=(8)只要沒有原始數據

都算不出來應該怎麼決定有統計意義的差距。差距的誤差就不是抽樣誤差。

結論：

再怎麼說藍白合民調比拼絕對不是拿兩個數字來相減然後說

喔你看在6%內然後另一邊說才不是明明是3%

這是需要民調專家學者去運算的
都已經找來兩個專業的來當裁判

原始數據都在這些人手上

明明是一翻兩瞪眼的東西結果演成這樣

所以我也看不懂朱立倫記者會到底在說什麼

至於柯說什麼3% 純粹是以為誤差值是固定3%

--

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.213.250 (臺灣)

※ PTT 網址

推

newwu 11/19 07:02說原始資料倒也不複雜，就是要有多少比例

→

newwu 11/19 07:02兩個情況都投藍白或賴蕭

推

sunhero 11/19 07:04這劇本讓大家覺得腦容量都不足了

推

witJeff 11/19 07:05這麼認真，阿北只是在營造被kmt 欺負的氛

→

witJeff 11/19 07:05圍凝聚白黨的支持而已。

推

KoenigseggG 11/19 07:06吵啥都假的啦，只有柯說要挽回年輕

→

KoenigseggG 11/19 07:06人支持是真。

→

KoenigseggG 11/19 07:08那天簽完後的反應，他自己也知道後

→

KoenigseggG 11/19 07:08果，後續只是在補救。

※ 編輯: brian900530 (1.161.213.250 臺灣), 11/19/2023 07:08:28

推

tr920 11/19 07:13基本上，兩個機率值直接相加減，就是智障

→

tr920 11/19 07:13等級的算法。你去問朱如果一張彩券中獎率

→

tr920 11/19 07:1350%，連買2張中機率多少，他肯定回答50%+5

→

tr920 11/19 07:130%=100% ，結論是朱比國中生還不如

推

melao 11/19 07:17結結論是柯候對賴有顯著差異，候柯對賴可

→

melao 11/19 07:17能沒有

推

doohan01 11/19 07:18柯的認知應該是H0:柯-侯<=3%

→

doohan01 11/19 07:20朱講的是統計誤差訂在3%，但6%是什麼鬼

→

doohan01 11/19 07:22信賴區間檢定又不是比極端值

推

uranus99 11/19 07:45柯文哲是說願意讓3%，一直都說他願意讓

→

uranus99 11/19 07:46這麼多，而不是真的誤差值這麼多吧

推

doubleperson 11/19 07:46推! 另外他們比的是與賴蕭差距的差

→

doubleperson 11/19 07:46，我是很懷疑這種相依母體內差距的

→

doubleperson 11/19 07:46差，有沒有人導過變異數的公式，你

→

doubleperson 11/19 07:47還不如直接柯侯減侯柯再來算變異數

→

newwu 11/19 07:53最複雜的情形，就是考慮相關性下，比與賴

→

newwu 11/19 07:53蕭差距，不過有原始資料都不難算，你就把每

→

newwu 11/19 07:53個人都當成paired data求差距的差距，再求

→

newwu 11/19 07:53變異數就好

→

newwu 11/19 07:55大不了bootstrapping 假如他們真心相信科

→

newwu 11/19 07:55學，這都不是問題

→

eolnikon 11/19 08:00讓幾趴其實是誰出錢導致的問題

推

cmplbbl 11/19 08:05跟九二共識一樣只有國民黨自為為已經取

→

cmplbbl 11/19 08:05得共識了

推

PeikangShin 11/19 08:09那個不是保守估計是叫做最大概似

→

PeikangShin 11/19 08:09估計值 MLE 所以p會用0.5去代入

噓

ztdxqa 11/19 08:11推！紅明顯。有raw data 絕對是可以算出c

→

ztdxqa 11/19 08:11ovariance的。

推

rayjames38 11/19 08:11覺得看起來不是都超爛是一邊在變形蟲

→

rayjames38 11/19 08:11規則想找到自己能贏（可能沒想過自家

→

rayjames38 11/19 08:11人表現這麼爛）另一個是根本沒想太多

→

rayjames38 11/19 08:11統計本身就不是重點不過願稱11/18是

→

rayjames38 11/19 08:11台灣統計日再補充點本身民調單一值

→

rayjames38 11/19 08:11已經要考慮誤差範圍差值是兩個有誤

→

rayjames38 11/19 08:11差範圍的值相減本身差值的變化就已經

→

rayjames38 11/19 08:11很大最後一個更扯是拿兩個不同基準

→

rayjames38 11/19 08:12的值在比

→

rayjames38 11/19 08:12然後別說什麼誤差+-3% 所以35%下 32%

→

rayjames38 11/19 08:12跟38%是沒有差別錯是在5%承擔風險下

→

rayjames38 11/19 08:12 如果得到35%結論有5%實際是32% 那如

→

rayjames38 11/19 08:12果你同時一邊取最差一邊取最好就是

→

rayjames38 11/19 08:12最好發生機率5%且另一邊發生機率是5%

→

rayjames38 11/19 08:12也就是5%*5% 0.25%的機率會發生這情況

→

rayjames38 11/19 08:12...

推

kudoe 11/19 08:14同意

推

rayjames38 11/19 08:16講白一點有raw data真的要算根本不

→

rayjames38 11/19 08:16用什麼讓可以直接算出兩邊各自勝出

→

rayjames38 11/19 08:16的機率密度

推

PeikangShin 11/19 08:18大哥這是抽樣你的cov僅能解釋單

→

PeikangShin 11/19 08:18一筆抽樣數據而已

推

tanjau 11/19 08:18講統計沒人看到懂啦有的炒數字出來誰強

→

tanjau 11/19 08:18誰弱一目了然這才是柯的目的

推

PeikangShin 11/19 08:21估計的不偏一致性質用什麼來說是穩

→

PeikangShin 11/19 08:21健估計就可以吵翻天了沒你想得那

→

PeikangShin 11/19 08:21麼簡單

推

duckosara 11/19 08:23專業統計

推

PeikangShin 11/19 08:33現在把獨立性質也拿掉了自由度會變

→

PeikangShin 11/19 08:33怎樣也還是待解決問題蚵仔提出

→

PeikangShin 11/19 08:33差距的差距又考慮不獨立時怎麼檢定

→

PeikangShin 11/19 08:33 說不定都可以寫一篇論文了

推

Clieff 11/19 08:38其實3％直接乘以根號2，取對國民黨有利的

→

Clieff 11/19 08:38樂觀值，也是3：3，反而要用原始資料考量

推

rayjames38 11/19 08:38其實還有個問題就是一直在講empirica

→

Clieff 11/19 08:39變異數檢討誤差區間，搞不好變異數會導致

→

rayjames38 11/19 08:39l rule上民調實際為結果的+-3% 這個

→

Clieff 11/19 08:39柯再拿下1點。

→

rayjames38 11/19 08:39應該是指雙尾95%信心水準而不是單邊5

→

rayjames38 11/19 08:39%雙尾其實是90%的信心水準（吧）如果

→

rayjames38 11/19 08:39是這樣那一邊最爛一邊最好的機率是2.

→

rayjames38 11/19 08:395%^2=0.0625%阿

推

PeikangShin 11/19 08:523％是蚵直接訂死誤差為3％依照美

→

PeikangShin 11/19 08:52好假設各家統計誤差無誤就是1.9

→

PeikangShin 11/19 08:526×(p(1-p)/抽樣數)^(1/2) @95％信

→

PeikangShin 11/19 08:53心水準 p代0.5(MLE性質) 這不用去

→

PeikangShin 11/19 08:53爭執了重點這個誤差是針對個人支

→

PeikangShin 11/19 08:53持度而已不能擴大去解讀兩方差距

→

PeikangShin 11/19 08:53 或是差距的差距因為by CLT後的尺

→

PeikangShin 11/19 08:53度參數不一樣這才是本文的原意

噓

zxc0312 11/19 08:59光是國民黨拿不出原始資料就不用討論讓

→

zxc0312 11/19 08:59幾趴了真的要討論聯合報那份也該剔除

→

zxc0312 11/19 08:59變成3：2 柯贏柯已經讓很多了

推

Amiwen 11/19 09:05這篇有厲害的統計學大大！

推

PeikangShin 11/19 09:13補充下兩方差距的誤差或是差距

→

PeikangShin 11/19 09:13的差距構成的誤差

→

PeikangShin 11/19 09:13如果蚵的誤差指的是原本支持度的誤

→

PeikangShin 11/19 09:13差那考慮獨立就是5：1 不考慮獨立

→

PeikangShin 11/19 09:13才有機會3：3 個人覺得蚵一開始誤

→

PeikangShin 11/19 09:13解統計用法最終就是依賴模擬來判

→

PeikangShin 11/19 09:13定差距的差距所構成的誤差值了很

→

PeikangShin 11/19 09:14不幸這個值也會有信心水準和誤差

→

PeikangShin 11/19 09:14只能說蚵把問題複雜化了

推

Caroney 11/19 09:24統研所明年碩班招生會大爆發嗎

推

PeikangShin 11/19 09:25然後豬頭敗類黨就是6％解釋方法錯誤

→

PeikangShin 11/19 09:25(跟蚵p犯了同樣錯誤?) 但豬頭主席

→

PeikangShin 11/19 09:25理論是OK的所以得證豬頭不是叫假

→

PeikangShin 11/19 09:25的而蚵專業知識似乎弱了豬頭一點

→

PeikangShin 11/19 09:25畢竟術業有專攻

推

hanmas 11/19 09:26推

推

chkao 11/19 09:35柯說3%是簡略說法，此數依樣本數不同而變

推

PeikangShin 11/19 09:45誤差不只是依照樣本數而變不同的p

→

PeikangShin 11/19 09:45也會變所以才叫你用MLE估計蚵

→

PeikangShin 11/19 09:45的3％明顯是對一個正常有效抽樣的支

→

PeikangShin 11/19 09:45持度只是個人不想講得那麼明不然

→

PeikangShin 11/19 09:46要像塔綠仔揮不完了如果去揮說是

→

PeikangShin 11/19 09:46指差距的差距小心迴力鏢打到自己

→

PeikangShin 11/19 09:46所堅持的科學

推

mikezip 11/19 09:56台大醫科教授怎麼可能不懂統計

推

hsuchengchun 11/19 10:08結論就是朱是假會計教授，亂算

推

intrepid123 11/19 10:250.5明明就會有比較大的區間 p(1-p) 0

→

intrepid123 11/19 10:26.25

→

intrepid123 11/19 10:26你用0.4*0.6會比0.25小抽樣誤差0.4

→

intrepid123 11/19 10:26已經是極限了考慮獨立但事實上是相

→

intrepid123 11/19 10:26關會更小

→

intrepid123 11/19 10:27總之不可能0.6這數字出來而且95%信

→

intrepid123 11/19 10:28賴區間已經更大了事實上也是讓到97.

→

intrepid123 11/19 10:285 因為不會出現另外的2.5% 用95%去做

→

intrepid123 11/19 10:28單尾檢定 1.64 比1.96 還更小

噓

smallredshoe 11/19 13:04會計教授你敢嘴？

→

smallredshoe 11/19 13:07我從來沒要求讓幾% 是他說平手算

→

smallredshoe 11/19 13:07我贏

推

ccm0916 11/19 16:49反正現在明確知道侯有多弱就夠了

推

Amiwen 11/19 17:09會計師最厲害就是做帳啊！做到有錢人都不

→

Amiwen 11/19 17:09用繳稅，做到侯友宜有臉說自己要當正的~｡

→

Amiwen 11/19 17:09

同系列文章

[問卦] 有沒有三方的統計學都超級爛的八卦

其他人也閱讀了

PTT 熱門相關