PTT評價

Re: [討論] 民眾黨內參民調原始數字流出

看板HatePolitics標題Re: [討論] 民眾黨內參民調原始數字流出作者
NewYAWARA
(朝霞之前奏)
時間推噓11 推:12 噓:1 →:16

※ 引述《a10141013 (FlyBall)》之銘言:
: https://i.imgur.com/pkUMcld.jpeg

[文長恕刪]

今天有索取到民眾黨官方寄來的所謂raw data資料,
有興趣的話可自行參閱: https://tinyurl.com/4tfhmhhv

以下是幾個比較明顯的問題點:

一、提供的並非是raw data資料
一般而言在民調上指的raw data,是指從調查或研究中直接收集到的數據,
這些數據在被記錄時尚未經過任何處理、分析或加權。

換言之,最好的情況是提供民調的SPSS檔讓人直接去做分析,
如果沒有的話,至少要包含市話加權前交叉表、手機加權前交叉表,
這樣才能更仔細的去做比對及推測使用的加權方式看看是否合理。
畢竟單純只說依照戶籍、年齡、性別、教育程度的多重反覆加權,
無法了解市話與手機合併時的各自樣本代表權重
(顯然不是單純的市話7手機3的比例下去合併)。

二、手機樣本的過度高估
由於民眾黨所提供的資料,並沒說明市話及手機整併時的權重,
但因為他們的交叉表有做「電話使用行為」,
所以大概可以推測是使用雙底冊方式整併。
但即使是雙底冊,也有不同的整併方式,這邊就不額外說明,
只是當民眾黨沒說明是怎麼整併時,我們不容易看出加權是否合理。

因為他們所提供的資料,沒有市話、手機在加權前的交叉分析表,
我們只能就手上既有的資料來做粗略的推論。
通常會出現問題的,就是在年輕樣本的估算上,
因為找到的樣本數少,所以一開始取樣時就容易有偏誤,
而願意接聽手機並作答的族群,有可能偏好與不接聽的有所不同,
就有可能會因此更加放大差異。

若我們就針對20-29歲的樣本來做粗略檢證的話,
我們得知加權後的柯盈配支持率是55.7%,
所以還原回來,樣本數是97份(174*0.557)。

而我們從柯盈配在市話加權後的數據是18.9%來看,
參照多數類似的市話民調,我們先假定在這個年齡層,
柯盈配拿到的是40%支持率左右,換算回來,
在市話的原始樣本則是22份(55*0.4),
接著從市話併手機的加權前數據,膨脹為加權後數據時,
權重是167%(104份樣本變174份樣本),
因此市話加權完後的樣本,則會因此膨脹為37份。

那麼,手機樣本在此佔多少呢?我們把加權完後總份數97份,
減掉市話樣本37份,所以我們可知手機樣本在加權後約佔60份。
而我們再把手機樣本還原為還沒加權前,大約是36份(60 / 1.67)。
36份則是佔手機加權前樣本的73.5%(36 / 49)。
換言之,柯盈配在手機的20-29歲原始樣本,可能是超過七成的支持率,
這與現實世界實際情況可能並不相符。

若是很單純的將市話及手機個別加權完後再整併,
那麼由於市話佔了70%的比重,在市話支持率40%、手機支持率73.4%的情況下,
整併後會是50%左右,會比兩種樣本先加起來,再開始加權後的55.7%要來的低。
而由於柯文哲佔優勢的30-39歲的樣本有著完全一樣的問題,
因此按照民眾黨的加權方式,對於柯文哲提升支持率就會有更大的幫助。

三、加權的不穩定
在這邊我們很明顯的會發現三個主要的問題:
1. 不同的加權方式會大幅影響最終的整併結果
2. 柯盈配在手機年輕樣本的支持率會有嚴重高估傾向
3. 手機看似只佔三成比重,實際上會因年輕樣本仍不足以彌補市話不足,
使得加權後會再更放大手機年輕樣本的偏誤(權重膨脹67%)

這也說明了為何純市話的加權後結果,
柯盈配的支持率僅是從13.2%膨脹為18.9%,
但是市話併手機後的結果,卻會大幅膨脹到27.6%的原因。


以上大概是幾點研究完民眾黨提供資料的想法,
最主要還是手機調查很可能會放大偏誤,
而市話併手機時,沒有詳細交代加權方式,
則會讓人無法信服,特別是在年齡加權會深刻影響結果時。
這些是民眾黨內參民調之後需要去克服的問題。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.66.250.226 (臺灣)
PTT 網址

gnd20012002 12/11 20:49結論:自我膨脹自爽用的民調

ok020402 12/11 20:50遠比沒資料還全市話的好太多了

gnd20012002 12/11 20:50好的哭15%

Hohenzollern 12/11 20:55侯友宜市話28.4%/手機25.6%/市話+

Hohenzollern 12/11 20:55手機卻倒扣到24.3%

a10141013 12/11 20:56覺得賴蕭/民進黨的票被分給柯盈/民眾黨

mark2326 12/11 20:56我知道你是誰了

a10141013 12/11 20:56手機比市話都少了10%以上

chu 12/11 20:57純市話族 柯5.5% 賴36% 真的老人殺手

phantasma 12/11 21:16這是各家民調裡面,唯一給數據的

phantasma 12/11 21:16希望其他家民調也願意開放

Amulet1 12/11 21:37憑什麼你覺得年輕沒到7成lol

當然還是依照統計證據說話。 依照各間的市話調查,20-29柯盈配大概都4成上下, 這是有比較長期及累積樣本的結果。 除非能夠有足夠證據說明,市話訪問到的年輕人, 偏好有與母體的年輕人有顯著差異, 否則沒辦法說明年輕人支持率到7成是合理的。

t21 12/11 22:12其他家有給嗎?

h129875230 12/11 22:12終於有個數學好的給推

h129875230 12/11 22:15國民黨 民進黨的盤才拿到八成 選的這

h129875230 12/11 22:15麼辛苦嗎

h129875230 12/11 22:17不過這些算法應該是市話手機先各自加

h129875230 12/11 22:17權完再去做 比例分配,而不是先把他

h129875230 12/11 22:17們加一起再做比例分配

不會,它不可能是各自加權, 如果是各自加權,一來不用先提供市話併手機的加權前數據, 二來手機的權重不足以把年輕支持率拉高那麼多, 連帶不可能讓市話併手機的結果,讓市話原本13%左右膨脹到27%多。

※ 編輯: NewYAWARA (210.66.250.226 臺灣), 12/11/2023 22:25:14

h129875230 12/11 22:27確實應該是你說的那樣 合併後再加權

h129875230 12/11 22:27 這樣抽樣剛好7:3 不過基本盤就是18

h129875230 12/11 22:27往上應該沒問題

h129875230 12/11 22:28手機抽樣明顯只用手機的柯盈支持度更

h129875230 12/11 22:28

h129875230 12/11 22:32合併之後再加權 我會覺得算法不太對

h129875230 12/11 22:32 這樣是把兩種抽樣當一個母群體 但我

h129875230 12/11 22:32直覺手機跟市話 各自生活圈差異太大

h129875230 12/11 22:32 應該要各自加權再做平均