PTT評價

Re: [黑特] 蔡壁如說柯P簽的時候知道是正負3%耶

看板HatePolitics標題Re: [黑特] 蔡壁如說柯P簽的時候知道是正負3%耶作者
axidefprothe
(理義質理)
時間推噓 1 推:1 噓:0 →:12

※ 引述《bulden (要死的生魚片)》之銘言:
: ※ 引述《LieChinDer (鍵盤仁醫)》之銘言:
: : 今天TVBS新聞大白話錄影休息時間,
: : 尚毅夫說他聽到的是當天兩個人都有跟柯P說是正負3%,
: https://web.ntnu.edu.tw/~494402345/CI/CI.pdf
: 大家可以去看這一篇的內容,基本上他用很入門的方式和例子在解釋信賴區域和信心水

: 的解釋。
: 一般台灣做的民調,大約一千份上下,那都會標注95%的準確度。
: 比如:
: 有一民調中心想調查市長甲候選人的支持度,隨機抽取的一個 1000 人的樣本,
: 其中有 570 位市民支持甲候選人,試求 95%的信賴區間。
: Solution.
: 由題意知:甲候選人支持度的統計量 ^P = 570/1000 = 0.57
: 標準差的統計量
: ^σ = √(0.57(1-0.57)/1000 = 0.57
: 2^σ≒ 2X0.0157≒0.031
: ^p-^σ≒0.57- 0.031= 0.539,^p+ 2^σ≒ 0.57-0.031=0.601
: 所以如果要調查95%的信賴區間為(0.539,0.601),而2^σ≒0.031表示抽樣誤差為3.1%
: 請注意這個信賴區間喔!是60.1%-53.9%=6.2
: 請記住,如果你用同一份樣本,做了100次,那你做出來信賴區間,幾乎落在同一個區

: 。但是如果你拿不同的樣本,那你的信賴區間就會偏離這個區間。
: 所以同一份民調,你得出來的兩個數據如果都在這個區間內,基本上是沒有差別的。


本質上,一切就只是個簡單的公式:

當 X, Y 兩個隨機變數的標準差都是 s 時,X-Y 的標準差 s' 是「根號(2-2r) * s」,其中 r 是 X, Y 的相關係數。

在對兩個候選人投票的情況中,相關係數 r 會很接近 -1 (因為通常你不投一個人就會投他的對手)。

帶回上面的公式就知道 s' 大概是 s 的兩倍。

這就是在你的討論中,為什麼會要把原來的統計誤差放大 2 倍。

但在這次柯侯 vs 侯柯的情況中,相關係數 r 非但不是 -1,還肯定大於 0(因為柯侯配跟侯柯配粉絲高度重疊)。

雖然我沒有實際民調的原始資料,但從公開資料判斷,這個 r 應該會大於 0.5。

帶回上面的公式就知道 s' 比 s 更小。

這就是為什麼柯辦當初記者會就提到:實際上「侯柯-柯侯」的統計誤差比原來的那個誤差小。

最後,再提一件事。

統計誤差那個公式其實是跟支持度有關的,支持度越接近 0.5,統計誤差越大。

只是我記得民調上為了讓人容易閱讀,都是寫支持率 0.5 的情況。

其實,如果支持率只有 0.3,那統計誤差只有原先的大概 9 成。

所以真要算的話,這部分也要注意。



--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.101 (臺灣)
PTT 網址

l983 11/20 19:23一堆統計專家

Supasizeit 11/20 19:30朱立倫是用絕對值在比,那就單一題就

Supasizeit 11/20 19:30好幹嘛分兩題

a09250955 11/20 19:31+-3% 是說結果會在這個範圍,不是讓你

a09250955 11/20 19:31一邊-3一邊+3

lono 11/20 19:37正確

dreambreaken 11/20 19:38我問個另外一個問題,如果照民眾黨

dreambreaken 11/20 19:39先跟賴比較,比較完再柯侯比較

dreambreaken 11/20 19:39最後結果是怎樣

這時候可以用上面的第二種情況先算出 「柯侯-侯柯」和「兩種情況的賴蕭」的誤差 e1 (會小於 3%),再對這兩個誤差 e1 做類似第一種情況的操作,可能又會再放大至多兩 倍(如果選舉規定每個人都必須投票而且不能投廢票,那就會比較接近放大兩倍,但因為 現實中可能有不去投票之類的,所以我也不知道到底能放大多少)。 所以會得到一個小於 6% 的東西,實際是多少非常 depends on 上面說的 r。

nnkj 11/20 19:39看誤差 柯文哲最多讓到2.9% 哪來的6%

侯陣營算的是 柯侯-侯柯,柯陣營是算跟民進黨的差距的差距,這兩種誤差本來就大概差 兩倍。柯說的是他們的那種算法,這樣如果讓 3% 就會平手。總之就是合約寫的不清不楚 ,有夠可笑。

※ 編輯: axidefprothe (140.112.25.121 臺灣), 11/20/2023 20:02:07 ※ 編輯: axidefprothe (140.112.25.121 臺灣), 11/20/2023 20:07:50

dreambreaken 11/20 22:15基本上兩種比法都沒有統計意義

dreambreaken 11/20 22:32如果是柯那邊的算法第二次計算的r

dreambreaken 11/20 22:33會非常的高