PTT評價

Re: [新聞] 還原王義川說法! 手機訊號就可以比對人

看板Gossiping標題Re: [新聞] 還原王義川說法! 手機訊號就可以比對人作者
EvilSD
(星塵遠征君)
時間推噓28 推:29 噓:1 →:96

分段來分析一下,如果是去識別化的資料哪些是可行跟不可行,以及哪些沒有識別化根本沒辦法比對

: 還原王義川說法,他27日在三立《新台灣加油》節目上說,立法院外的集會,大部分都是: 一般的公民,「按照這一個分析的資料看起來,其實這一次活動,我跟各位講一個數字,: 20歲到40歲,就是有些是小草,有些當然太陽花的,佔了整個活動的6成。」

年齡跟人流數量是可行的
但小草? 太陽花? 資料哪來?怎麼標記?怎麼比對
更別說太陽花是十年以前了


: 王義川接著說,「我們用手機去看他的年齡,差不多6成,20歲以下的,大概佔了1成2,: 所以大概有7成2是70歲以下的(應為40歲以下),那這些人不是政黨那麼容易動員,民進: 黨如果有辦法,有本事就對了,網路找一找,再跟大家說,(台中市議員)周永鴻你找小: 弟來,跟年輕人說,不能說是周永鴻找的,如果有辦法這樣,就有辦法叫這麼多人來,民: 進黨這次就不會在立法院沒過半了。」

年齡可行


: 王義川說,「那些臉孔,民進黨很久沒看到,就是那一些,那些在場年輕人的臉孔,民進: 黨很久沒看到,第二個,這些人跟原來的小草,我們有去比對過,他跟原來這個517、在: 民進黨樓下的、那些小草的訊號比起來,也不同人,就是說,小草也沒跑,但是這一批人: ,跟上次我們選舉,1月13之前的選前之夜的人比對,也沒關係。」

臉孔沒見到(希望不是連人臉都建檔比對了)

517,民進黨樓下(地點不同,如何建檔標記?)

小草的訊號(所以是小草都被標記了?不然怎麼知道是小草)

1月13選前之夜(所以那晚的人都被標記了?)



: 主持人許貴雅還驚訝問,「現在時代進步到可以這樣比?」王義川說,「因為你去對他的: 什麼那個基地台訊號,對得到。所以你就可以知道,這純粹是一批全新的人。」
: 民進黨發言人吳崢幫忙解釋,以相關資料與報導來看,民進黨選前之夜輪廓「年齡層偏大: 、男性居多」;民眾黨519輪廓「年齡層偏年輕,男性居多」;立法院524輪廓「各年齡層: 分佈均勻,女性略多於男性」。參與者的輪廓明顯顯示出524的群眾與519、民進黨選前之

性別,年齡層可以被識別分析


然後最好別都鬼扯AI,AI在學習前也是需要標記資料的,沒資料哪知道誰是小草誰是覺青但更簡單來說,假設可以拿到識別化的資料,做出這個系統基本不難
畢竟疫情期間,中華電信都做好疫情流向追蹤了



--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.225.144 (臺灣)
PTT 網址

FrancoFF 05/31 02:38哈哈

imgkiller 05/31 02:42中華電信 年齡跟性別地點都標示了,這

imgkiller 05/31 02:42個有啥好不能標的,去519的就標成小草

imgkiller 05/31 02:43錯5%有差嗎

imgkiller 05/31 02:43對應的年齡性別等特徵,就可反推是不是

imgkiller 05/31 02:44小草,這不是就最簡單的ML

imgkiller 05/31 02:44知道微軟之前出一款圖形識別,把黑人錯

給你年齡性別,你做一套ML告訴我怎麼區分小草跟覺青

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:46:33

imgkiller 05/31 02:45認爲猩猩,你管人家怎麽標記的。本來就

imgkiller 05/31 02:46求一個大概而已。40%20%分析報告隨便寫

imgkiller 05/31 02:46我願意標記20嵗年輕人就是小草呢

imgkiller 05/31 02:47買家願意買單就好

imgkiller 05/31 02:47你以爲這種大數據分析,要精確到哪

imgkiller 05/31 02:48這個是走量的,當數量夠大,一些判斷錯

imgkiller 05/31 02:48誤根本不影響結論

越來越弔詭了,之所以要大數據分析,就是要避免母群體數量過少 導致overfitting,沒有正確標記的資料,又要如何做模型呢? 假設今天只有年齡跟性別,根本無從分析誰是小草誰是覺青 能夠有辦法分析的只有識別化資料,直接進行標記

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:52:00

greenpeter 05/31 02:49有沒有一種可能,他們早就透過資料庫

greenpeter 05/31 02:49,透過演算法把每個使用者都做了政黨

greenpeter 05/31 02:49傾向的標記?因為這樣才能解釋的通,

greenpeter 05/31 02:49王義川提到的小草與其他年輕人的族群

greenpeter 05/31 02:49特徵。如果是這樣,那麼這個資料庫顯

greenpeter 05/31 02:50然已經變成政黨操弄非我族類最強的傳

greenpeter 05/31 02:50播工具…

imgkiller 05/31 02:51那樣要中華電信配合,我不覺得中華電信

imgkiller 05/31 02:51有這個動機去為民進黨搞

如果要達成王義川說的事情,就是每一次的群體活動,就進行標記並且存入資料庫 不然根本不可能連十年前的太陽花,都能夠清楚的知道是不是同一群人

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:53:52

imgkiller 05/31 02:53我把當天去519都標記為小草,其實能誤

imgkiller 05/31 02:54差到哪?5%?有小草會帶女友去?

問題來了你要怎麼標記 你只有性別跟年齡,這點資料怎麼區分?

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:55:40

imgkiller 05/31 02:55大數據説穿了,其實充斥很多垃圾報告

imgkiller 05/31 02:55很多是亂寫亂下結論的,要對上級或買家

imgkiller 05/31 02:56交代。

imgkiller 05/31 02:56那些模型也只是個預估,既然是預估,就

imgkiller 05/31 02:56有些是準的,有些差很多

能夠區分太陽花跟這次青島的人不一樣 這點應該不是亂做或是隨便預估得出來的

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:58:28

imgkiller 05/31 02:58519過去的為小草,而那邊年齡20~25男佔

imgkiller 05/31 02:59大比例,那就把524的20~25的男當作小草

imgkiller 05/31 02:59也許就得出524去的小草很少的推論

imgkiller 05/31 03:00這種分析報告,只要寫出邏輯,買家願意

imgkiller 05/31 03:00買單就行

imgkiller 05/31 03:01統計太多方法可以區分了 兩個群體相似

太好了,明天我就來實作一下到底有沒有可能,而且精準度多少 就從最簡單的統計到機器學習深度學習都跑一輪 而且別忘了王義川說的不是AI或是統計比對 他說的是訊號比對

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 03:03:54

imgkiller 05/31 03:01度,特徵abcde,你做不到嗎

imgkiller 05/31 03:02現在最實用的大數據商業模式是 推測買

imgkiller 05/31 03:03家可能喜歡什麽樣的商品,推這些給他們

imgkiller 05/31 03:03這個不必政黨傾向難得多?

這個是透過搜尋紀錄來丟廣告,除非他們能夠過這個來分析政黨 那就難上更多了,這可就是美國稜鏡計畫等級了

aeug2005 05/31 03:04製造恐慌

※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 03:06:04

gawoolala 05/31 03:05台電都能為党洗地了種花會配合不意外

ininder30cm 05/31 03:06應該不少大學生門號名子都還是父母

chyou2003 05/31 03:15其實我覺得,他分析是想當然耳亂做,但

chyou2003 05/31 03:15要解釋就會被看破之前都是唬爛…

imgkiller 05/31 03:16很多推廣就不是靠搜索記錄啊

imgkiller 05/31 03:18搜索記錄是最直接的沒錯

imgkiller 05/31 03:18最典型的是 專門賣衣服的網站,你怎麽

imgkiller 05/31 03:19推他們可能買的衣服類型

gueswmi 05/31 03:22不是阿 哪家電信承認有撈資料了

gueswmi 05/31 03:23反正大家都說合法,其他人也可以買了吧

monitor 05/31 03:25三大電信業者都沒有和王義川合作,

monitor 05/31 03:25顯然資料是竊取來的,既然是竊取而

monitor 05/31 03:25來的個資,當然是要拿具有識別化的

monitor 05/31 03:25完整個資才有價值。

allyourshit 05/31 03:34看起來就是中華電信這狗東西流出去的

monitor 05/31 03:35用含識別化的完整個資去餵AI,那一

monitor 05/31 03:35切不就合理了嗎

tortoise1017 05/31 03:49樓上不用噓? 原PO是用假設 來證明

tortoise1017 05/31 03:50 去識別化的數據無法導出王在節目上

tortoise1017 05/31 03:50的分析. 又不是在討論數據出處

friends29 05/31 03:52要洗地之前也先做點功課行不行 哈哈

friends29 05/31 03:53只有年齡跟性別 到底要怎麼在不同時間

friends29 05/31 03:53點區分政治傾向

monitor 05/31 03:59所以王在節目上的說法,前提自然是

monitor 05/31 03:59已取得具識別化的完整個資,那如果

monitor 05/31 03:59三大電信業者都沒有提供任何大數據

monitor 05/31 03:59的資料給王義川,那顯然資料的取得

monitor 05/31 03:59自然是用偷的了

monitor 05/31 04:01如果有了民眾的門號,自然也可以用

monitor 05/31 04:02門號來比對之前所有手機民調的政黨

monitor 05/31 04:02傾向

molimoli 05/31 04:52都知道太陽花是10年前了,看年紀就

Shingen 05/31 05:08我懷疑民進黨一直在監控人民

andy199113 05/31 05:21https://i.imgur.com/DXnY9u3.png

andy199113 05/31 05:22建構台灣第一套人工智慧選情預測系統

andy199113 05/31 05:23台灣第一套人工智慧虛假新聞處理系統

andy199113 05/31 05:23規劃台灣出入境電子通關系統

katzlee 05/31 06:01這種誇張的事都能護航的人到底是有多失智

sca133 05/31 06:02紅綠一家親 有天眼過份嗎 讓你們習慣統一

coffee112 05/31 06:03對岸有天眼維尼 台灣有民進党王義川

imhanhan 05/31 06:28真的不用跟哥布林浪費口舌,大家心裡都

imhanhan 05/31 06:28知道答案,別欺騙自己

ggirls 05/31 06:29真的心裡有數。你們真的相信網友肉搜這麼

ggirls 05/31 06:29厲害喔。

heat0204 05/31 06:52他原本是想炫耀 不是選前之夜的老人

heat0204 05/31 06:52他們又成功拐到一群笨鳥吧

jickey 05/31 06:59真的有做去識別化就不可能像憨川說的精準

jickey 05/31 06:59比對啊

doctor75 05/31 07:02電信業者既然能把資料因為錢或是權力給

doctor75 05/31 07:02出來。難保不會給中國。現在中國除了有

doctor75 05/31 07:02戶籍資料。連政治性向都有了。

johnny3 05/31 07:02最簡單就這個門號10年前有沒有去過立法

johnny3 05/31 07:02院啊

buski 05/31 07:12有興趣可以看看政府採購資料網的人潮客群

buski 05/31 07:12分析

joua0214 05/31 07:34有沒有一種可能 就是他在唬爛 不小心唬

joua0214 05/31 07:34出問題

ChungLi5566 05/31 07:40足跡也是個資

chocoball 05/31 07:50去買uniQ 晚上7點去買超商等於小草(x

cms6384 05/31 08:02519遊行就在記錄個資了 不然怎麼分別

cms6384 05/31 08:02你們小草還敢去拿便當阿 被記錄了吧

tskier 05/31 08:19

liker1412 05/31 08:20我就問給你新北耶誕城和台中景點兩份已

liker1412 05/31 08:22經去識別化的資料 是要怎麼知道去耶誕

liker1412 05/31 08:22成的人流有沒有重複?

liker1412 05/31 08:23 和台中景點

foxher 05/31 08:31重點是手機是否『被標記』或提供tag

foxher 05/31 08:31能否從兩批不同數據中識別出相同手機

foxher 05/31 08:31在來就是這個資料能否連結到個人

jagger 05/31 08:52兩場活動的訊號比對,就需要識別化

jagger 05/31 08:52才能知道有沒有重複出現

pttocean 05/31 08:58只要有辦法統計門號資料,搭配一些自家

pttocean 05/31 08:58的民調公司Data,要統計政黨傾向有什麼

pttocean 05/31 08:58難的

tw11509 05/31 09:03樓上的意思是王憨川可以拿到門號,你確

tw11509 05/31 09:03定你要這麼說?笑死

GABA 05/31 09:31AI可以識別個人手機資料 這比監聽集會人民

GABA 05/31 09:31還驚悚

sober168 05/31 09:56我覺得他只是上節目唬爛過頭收不回來….

bluu 05/31 11:24雙標傻鳥不會承認自己的主子是拉基的

bluu 05/31 11:27人民的門號可以這樣隨便拿去跟民調公司比對

bluu 05/31 11:27難怪前幾天新聞有一個老杯杯氣到跑去警察局

bluu 05/31 11:27找警察幫忙封鎖來電警察一看全詐騙電話

godchildtw 05/31 12:29塔綠班把2300萬人的個資都已經出賣了

godchildtw 05/31 12:29,再加這筆手機監控有什麼好奇怪的