PTT評價

Re: [問卦]5/17的確診人數增加了52%,且數據不合理

看板Gossiping標題Re: [問卦]5/17的確診人數增加了52%,且數據不合理作者
Sixigma
(六西格瑪)
時間推噓 8 推:10 噓:2 →:31

有幾個瑕疵:

1. 何謂「比例應該要差不多」

最簡單的就是假設檢定吧,小樣本的狀況下,統計量本來就可能差很多

可以想想 normal distribution 的兩側



2. 時序資料的 seasonality

舉例來說,夏天下的雨比較多,冬天較少

但你不會說冬天好怪,因為那是它的seasonality

我沒公衛流病專業,但不嚴謹的推廣到疫情上

你可以想像一開始只有少數人感染

當感染人數越來越多、潛伏期結束,陽性自然上升

你只看不到兩個禮拜的趨勢,根本不可能考慮其seasonality



3. 前後時間並非來自同一分佈

你這邊是假設後來的數字與原先的是同一時間送檢

所以前後相差很大有問題

但即便如此,也可能有很多因素導致他們不是來自同一分佈

譬如說後來篩檢策略的進行限縮(或更精準),導致檢測到陽性的可能大幅上升

(如台中朝陽太多偽陽,所以後來沒驗了)




只能說這推論很有想法,但不太準確

雖然忝為本科系學生,但統計都還老師了

稍微想一下大概這樣,有前輩再請指正



補個,我是柯粉

幹你娘民進黨

※ 引述《rey123123 (小肥羊)》之銘言:
: 因為時間不多,我只拿5/17的確診人數做分析,但其實其它天數也有類似的狀況。根據: CDC公布的資料,從第一次校正回歸開始到現在5/25號為止,5/17的確診人數從333增加到: 510,多了52.2%。 再來,假如公視在5/23節目中所提供的數據為真,可以得知5/17共有: 8458已通報,其中未確定的病例有1801。我這邊假設5/17已經不會再有校正了 (雖然我覺: 得不可能)。那簡單的推算可以得知,
: 校正回歸前,已驗完 6657 (8458-1801) 例,其中333例為陽性,佔 5%
: 校正回歸後,增加 1801例,其中177(510-333)例為陽性, 佔 9.8%
: 可以看到,新增加的病例,陽性率為將近兩倍。統計角度來看,因為驗的數量都是幾百、: 幾千例的規模,這兩個比例應該要差不多才對 (e.g. 5% vs 5.5%),而現在這個變動幅度: 之大,已經完全無法用隨機發生這概念去解釋了。甚而,如果5/17還有沒驗完的病例,: 那更不止9.8%這個數字。
: 合理來看,我認為只有以下幾種可能:
: 1. 公視資料為假,未確定病例遠大於1801。到5/25為止,5/17日已驗完的數量也遠大於: 8458例。
: 2. 有人為操作回報病例的順序。也就是說人為上把陽性機率比較低的病例放在「校正」前先
: 回報。之後才補上其它的。
: 3. 天意。就是這麼神奇,神就是把陽性的病例放在後面。如果是這樣,那我無話可說。: 也許還有許多我沒想到的可能,歡迎大家一起討論。但是不管怎樣,這數字增加的幅度: 已讓這些統計遠遠失真。我在之前的文章也有提到大家要注意這個校正回歸後,增加的幅: 度,而現在情況又更超乎我之前的想像了。真心呼籲CDC,把所有的資料公開出來,到底: 每一天還有多少還沒驗,流程是在哪裡慢了。病毒無眼,現在的決策背後都是幾萬條人命: 。檢驗能量不夠絕對不是新聞,每個國家去年都經歷過這樣的事情,重點是怎麼解決它。: 「優化處理過程」、「增加實驗室人員」、「減去繁瑣行政公務」都是可能的解決辦法。: 把事情透明化、講出來,其他專業人才才跳得進來。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.85.129.123 (臺灣)
※ 文章網址: https://www.ptt.cc/Gossiping/M.1621959319.A.FCF

DawnSlight 05/26 00:16今天只有中央能出來解釋清楚

qilar 05/26 00:16上千例還算小樣本?

以時序資料觀點,幾個病例不是主要被關心的,時長才是

mynameisdick 05/26 00:17建議二樓去讀一下統計學....

mynameisdick 05/26 00:17這跟大樣本、小樣本無關,而是「結

mynameisdick 05/26 00:18論」這樣下是有問題的,兩邊的抽樣

mynameisdick 05/26 00:18群體是不同的,還有這篇原PO說的因

rey123123 05/26 00:18是的,謝謝您的補充。我原文的確省略很

mynameisdick 05/26 00:18素,這些情況下不能這樣下「結論」

rey123123 05/26 00:19多詳細的假設。我想重點在於兩倍陽性率

rey123123 05/26 00:20我認為還是太高。當然詳細的檢定還是

rey123123 05/26 00:20需要更多的計算與假設才能得知

我覺得現在看都還早,尤其根本沒說清楚 這些數字是哪裡來的、怎麼收集的、什麼導致時間差

AbdulRauf 05/26 00:21我比較想問如果5/17的現在才確診,那

AbdulRauf 05/26 00:21這個人是早就在隔離治療了還是只需要

AbdulRauf 05/26 00:21自主管理,如果是後者那就恐怖了

我也比較想問不是數據的問題。 我只想知道現在還在補 5/16 的是什麼意思。

spa41260 05/26 00:21你們當兵是不是沒填過洞洞兩表?

spa41260 05/26 00:23校正回歸都有死亡案例回填,你們還這麼

spa41260 05/26 00:23認真?這好嗎?

abc32521 05/26 00:24原PO是因為只計算5/17一天 且目前校正

abc32521 05/26 00:25的天數還不夠多 可以多觀察幾天

abc32521 05/26 00:25我認為原PO觀察的現象可能是真的

abc32521 05/26 00:25越晚校正的案例陽性率會越高

rey123123 05/26 00:26是的,所以才呼籲CDC公開所有資料

abc32521 05/26 00:26至於原因...有幾分證據才能公開講幾分話

abc32521 05/26 00:27坦白講"校正"是否能反映疫情資訊

abc32521 05/26 00:27我是覺得幫助有限 因為要看新增病例是否

abc32521 05/26 00:28趨緩原本就會以周為單位來觀察是否解封

abc32521 05/26 00:28那麼外國最簡單方式就用移動平均來觀察

rey123123 05/26 00:31對。歐美大多抓七天平均來看趨勢。不過

birdy590 05/26 00:32說穿了就系統爛啊 欄位降低還是沒解決

rey123123 05/26 00:32台灣現在採檢數還很低。難有公信力

birdy590 05/26 00:32我猜那個中央資料庫從來沒想過會有這麼

birdy590 05/26 00:32多資料會塞進去~

Maniacs 05/26 00:33推這篇

birdy590 05/26 00:33昨天報導還有提到上傳還是很卡的

gn01838335 05/26 00:38假設就是錯誤

gn01838335 05/26 00:39真正染疫時間是x 用未知定義推估盛行

gn01838335 05/26 00:39率。嗯…

Err....蛤?

※ 編輯: Sixigma (219.85.129.123 臺灣), 05/26/2021 00:42:02

AALLSS 05/26 00:50

flywater 05/26 00:54其實巧芯那篇出來後第一篇也不用回了

flywater 05/26 00:55校正回歸就不是通報未排除那邊來的

SP500 05/26 01:33幾天之內的事還時序個毛 誤導文自刪吧

tsainalunba4 05/26 01:36

Stunts 05/26 01:54上千例哪裡小群體了