Re: [新聞] 柯P遭疑民調加權才贏侯友宜 柯辦反擊了!
大哥,你寫的那麼複雜誰看得懂@@?
所以你用程式這樣跑出來的結果
到底賴柯侯的支持度大概各是多少?
※ 引述《ulycess (ulycess)》之銘言:
: ※ 引述《Homura (德意志國防貓)》之銘言:
: : 我們以黃揚明提供的
: : 求真民調的資料來舉例
: 我也對加權很奇妙,所以我直接拿程式模擬誤差範圍
: 首先我定義誤差範圍如下
: 假設20~25歲的人群百分比是20%
: 這次抽1000人,理論上應該要有200人
: 實際上這次民調在20~25%的人有210人
: 誤差則為 絕對值(210-200)/200 = 5%
: 最大誤差範圍則為該次民調中各分組誤差範圍最大組別
: 首先我用一次民調抽9000人,進行10000次民調,得到結論是
: 最大誤差範圍5%以內,共占有21.77%
: 最大誤差範圍5~10%以內,共占有74.46%
: 最大誤差範圍10~15%以內,共占有3.71%
: 最大誤差範圍15~20%以內,共占有0.05%
: 最大誤差範圍20~25%以內,共占有0.0%
: 最大誤差範圍超過25%,共占有0.0%
: 接下來我用一次民調抽3000人,進行10000次民調,得到結論是
: 最大誤差範圍5%以內,共占有0.62%
: 最大誤差範圍5~10%以內,共占有37.92%
: 最大誤差範圍10~15%以內,共占有49.78%
: 最大誤差範圍15~20%以內,共占有10.63%
: 最大誤差範圍20~25%以內,共占有1.01%
: 最大誤差範圍超過25%,共占有0.03%
: 最後我用一次民調抽1000人,進行10000次民調,得到結論是
: 最大誤差範圍5%以內,共占有0.01%
: 最大誤差範圍5~10%以內,共占有1.76%
: 最大誤差範圍10~15%以內,共占有20.04%
: 最大誤差範圍15~20%以內,共占有35.97%
: 最大誤差範圍20~25%以內,共占有26.3%
: 最大誤差範圍超過25%,共占有15.91%
: 所以我的結論如下
: 如果用9000人來比民調,96%的機率誤差範圍在10%以內
: 所以加權範圍不應該超過10%才對
: 如果用3000人比民調
: 最有可能的最大誤差範圍是10%~15%之間,所以加權範圍不應該超過15%
: 至於用1000人比民調
: 最有可能的誤差範圍是15~20%,而且標準差極大
: 這時候才有加權的必要
: 程式碼如下,請用python開啟
: import random
: 抽多少人 = 1000 # 預設一次抽9000人來比民調
: 總共進行幾次民調 = 10000
: 台灣人口分布 = {
: "20~24": 1345864,
: "25~29": 1591927,
: "30~34": 1589933,
: "35~39": 1672483,
: "40~44": 2009683,
: "45~49": 1827312,
: "50~54": 1770183,
: "55~59": 1782312,
: "60~64": 1715580,
: "65~69": 1489738,
: "70~74": 1115706,
: # "75~79": 593730,
: # "80~84": 468252,
: # "85~89": 262833,
: # "90~94": 119210,
: # "95~99": 31423,
: # "100+": 4901,
: }
: 台灣總人口 = 0
: for i in 台灣人口分布:
: 台灣總人口 = 台灣總人口 + 台灣人口分布[i]
: 誤差絕對值 = {"3%以內": 0, "3%~6%": 0, "6%~9%": 0, "9%~12%": 0, "超過12%": 0}
: def 預期每個組別應該有多少人(抽多少人):
: result = {}
: for i in 台灣人口分布:
: result[i] = 抽多少人 * (台灣人口分布[i] / 台灣總人口)
: return result
: def 抽人口確定是哪個組別():
: 分組在哪裡 = ""
: random_number = random.randint(1, 台灣總人口)
: for i in 台灣人口分布:
: random_number = random_number - 台灣人口分布[i]
: if random_number <= 0:
: 分組在哪裡 = i
: break
: return 分組在哪裡
: def 開始抽人口(抽幾次):
: 抽完的人口組別 = {}
: for i in range(1, 抽幾次):
: 開始抽籤 = 抽人口確定是哪個組別()
: if 開始抽籤 not in 抽完的人口組別:
: 抽完的人口組別[開始抽籤] = 1
: else:
: 抽完的人口組別[開始抽籤] = 抽完的人口組別[開始抽籤] + 1
: 最大誤差值 = 0
: for i in 抽完的人口組別:
: 誤差百分比 = abs(100 * (預期每個組別應該有多少人(抽幾次)[i] - 抽完的人
: 口組別[i]) / 預期每個組別應該有多少人(抽幾次)[i])
: # print(誤差百分比)
: if 誤差百分比 >= 最大誤差值:
: 最大誤差值 = 誤差百分比
: return 最大誤差值
: # print(開始抽人口(9000))
: 誤差值範圍 = {
: "5%以內": 0,
: "5~10%以內": 0,
: "10~15%以內": 0,
: "15~20%以內": 0,
: "20~25%以內": 0,
: "超過25%": 0,
: }
: for i in range(1, 總共進行幾次民調):
: 開始抽人 = 開始抽人口(抽多少人)
: if 開始抽人 < 5:
: 誤差值範圍["5%以內"] = 誤差值範圍["5%以內"] + 1
: elif 開始抽人 >= 5 and 開始抽人 < 10:
: 誤差值範圍["5~10%以內"] = 誤差值範圍["5~10%以內"] + 1
: elif 開始抽人 >= 10 and 開始抽人 < 15:
: 誤差值範圍["10~15%以內"] = 誤差值範圍["10~15%以內"] + 1
: elif 開始抽人 >= 15 and 開始抽人 < 20:
: 誤差值範圍["15~20%以內"] = 誤差值範圍["15~20%以內"] + 1
: elif 開始抽人 >= 20 and 開始抽人 < 25:
: 誤差值範圍["20~25%以內"] = 誤差值範圍["20~25%以內"] + 1
: else:
: 誤差值範圍["超過25%"] = 誤差值範圍["超過25%"] + 1
: for i in 誤差值範圍:
: print(f"最大誤差範圍{i},共占有{100*誤差值範圍[i]/總共進行幾次民調}%")
: : 四腳督市話加權前
: : 賴清德 748 35.47%
: : 侯友宜 535 25.37%
: : 柯文哲 230 10.91%
: : 郭台銘 125 5.93%
: : 市話單獨加權後
: : 賴清德 685 32.49%
: : 侯友宜 433 20.52%
: : 柯文哲 382 18.12%
: : 郭台銘 163 7.74%
: : 四腳督手機加權前
: : 賴清德 239 26.21%
: : 侯友宜 143 15.68%
: : 柯文哲 305 33.44%
: : 郭台銘 87 9.54%
: : 手機單獨加權後
: : 賴清德 251 27.52%
: : 侯友宜 150 16.46%
: : 柯文哲 257 28.21%
: : 郭台銘 85 9.27%
: : 市話手機合併加權後
: : 賴清德 887 29.35%
: : 侯友宜 513 16.98%
: : 柯文哲 758 25.09%
: : 郭台銘 255 8.44%
: : 原始資料侯的市話+手機是678、22.44%
: : 柯文哲是535、17.71%
: : 經過柯學加權後
: : 侯友宜變成513、16.98%
: : 柯文哲則是758、25.09%
: : 有人可以解惑一下
: : 為何柯文哲市話加權特別高?(230→382)
: : 然後侯從原本的+143變成-245
: : 一來一往落差將近400
: : 加權的依據是?
--
4
陳智菡強調,純市話也會加權,原始調查資料不可能直接符合台灣年齡分布、性別、戶籍 、教育程度四項結構,所以不管是網路問卷、市內電話、手機電話、手機簡訊,通通都 ?: 要將原始樣本加權調整至符合上述四項結構的比例。 這句話是對的..但盲點在 4天內打了3000份,,包含手機+市話 1.500手機加500市話 可不是直接合併就加權 還要看裏面有多少人只用手機72
我們以黃揚明提供的 求真民調的資料來舉例 四腳督市話加權前 賴清德 748 35.47% 侯友宜 535 25.37%9
現實上 每家民調都有加權 柯P算是第一個大方把加權前後的數字秀出來的 所以酸啥科學民調就算了 除非每家都秀出原始和結果,才能笑柯P這個是科學民ㄊㄧㄠˊ 而且真要真要科學民ㄊㄧㄠˊ17
這邊柯文哲加了8% 這是族群偏差的原因 調查出來的結果會依族群比例回歸母數 用個簡單的舉例方式好了 20~40歲 40~60歲 60歲以上2
就是市話年輕票加權啊, 你要在這種市話越來越少人裝的時代, 找到人接市話,又剛好是年輕人機率很低, 問接到且願意進行民調,自然要加權多一點, 因為這個年輕選民的投票意願肯定也很高。2
美麗島的調查方式如下 樣本代表性與加權:採用「比例估計法」 (raking ratio estimation),本次調查的母 群體參數是依內政部公布2023年9月民眾性別、戶籍、年齡資料,與2022年12月民眾教育 程度等特徵,逐項重複進行連續性修正,使得樣本特徵與母群體結構一致(達統計檢定顯5
推 patiger: 簡單來說,市話抽樣2000筆,手機抽樣100 223.138.72.36 11/09 15:15 → patiger: 0筆,樣本合計3000筆來說 223.138.72.36 11/09 15:15 → patiger: 但是認為這樣不公平 223.138.72.36 11/09 15:15 → patiger: 最後再調整成樣本合計3000筆是沒錯,但 223.138.72.36 11/09 15:15 → patiger: 是市話跟手機樣本數調整成各1500筆3
是說柯文哲當初創立民眾黨,就是秉持"垃圾不分藍綠"。 現在要弄藍白合,還真以為是算算數,藍白相加完,選民都不會有人跑票喔? 再來大家一直把焦點放在總統的民調,要不要比一下民眾黨/國民黨區域立委的民調啊? 如果藍白真的合的了,是藍或白的立委候選人要退,也是要好好喬的啊。 個人認為,柯文哲、侯友宜和朱立倫,就只是戲演給各自支持者看,都是對方在機掰,
15
Re: [新聞] 柯P遭疑民調加權才贏侯友宜 柯辦反擊了!並不是市話50%+手機50% 因為這樣結果就是調整後市話和手機的相加 也就是 賴936侯583柯639 但是最後的結果確實5
Re: [新聞] 柯P遭疑民調加權才贏侯友宜 柯辦反擊了!我很好奇 請問美麗島加權之前的數據去哪裡查? 就最近這幾波就好 因為柯P公布的市話加權結果 其實 和美麗島結果很接近 有可能雙方其實是用同一套加權公式而已2
Re: [新聞] 柯P遭疑民調加權才贏侯友宜 柯辦反擊了!再談一下加權 以最簡單的年齡加權來說 台灣各年齡層比例大概都是15~19% 簡單一點等分話來說假設各年齡層選舉人口比例是 20~29 20%1
Re: [新聞] 柯P遭疑民調加權才贏侯友宜 柯辦反擊了!這就沒什麼好吵的 根據美麗島68 最新民調/白快看不到藍車尾燈?侯友宜、柯文哲差距再拉大8.1% 再根據民調之神的正負誤差 戴立安解釋,抽樣誤差範圍可有幾項條件決定,一是信賴水準,寬鬆90%、嚴格99%,一
23
[討論] zeuswell深夜跟板友道歉56
Re: [新聞] 謝宜容是菊系人馬?許銘春否認:當時往上4
Re: [討論] jacklyl 深夜跟政黑板友道歉9
[討論] 陳菊跟許銘春再騙誰?5
[討論] 放心吧,弄不出一場遊行的4
Re: [黑特] 台中76小時意外死6人 藍白畜嘞?5
[討論] 會霸凌的怎都醜女5
Re: [討論] jacklyl 深夜跟政黑板友道歉6
[討論] 好奇領導人私下會談用哪種語言?3
[討論] 來講講浮屍吧16
[討論] 珠海汽車撞人傳3死 本日獻忠任務(1/1)6
[討論] 黃國昌也太容易被騙了吧?4
[討論] 賴總統的火22
[黑特] 我幹你娘勞動部:通靈內容為家屬轉述4
[討論] 普丁最新談話(2024.11.21。21:09)2
[討論] 為什麼支那人寧願殺平民也不願意殺高官3
[討論] 謝宜容到底是陳菊還是黃國昌的人啊?3
[黑特] 菜價還要漲多久啊!5
Re: [新聞] 堅持中華民族立場 朱立倫喊話賴清德:「7
[討論] 川普與習近平的私人關係感覺不錯23
[討論] 某群人是不是已經沒有良心道德了?X
[討論] 賴清德和黃國昌某方面很像2
[討論] 波波醫生沒人討論了?11
[黑特] 謝宜容這事件重創民進黨7
Re: [新聞] 勞動部公務員疑遭霸凌輕生 亡者媽媽淚1
[黑特] 希望國昌跟Matt Gaetz一樣識時務2
[黑特] 一堆老人不爽綠但是不同情死者6
[黑特] 謝宜容失聯、陳啟昱落跑