PTT評價

Re: [討論] 王義川手機定位翻車確定

看板HatePolitics標題Re: [討論] 王義川手機定位翻車確定作者
Mimmature
(Musicians Immature)
時間推噓13 推:14 噓:1 →:53

沒有要替誰背書

純粹就資訊業的正常資料分析原理做說明

先說結論:基礎的分析報告 跟個資無關

但是歐盟的gdpr跟加州的ccpa有針對「資料蒐集」做限制

要求各平台要告知使用者並「同意」(Consent)後才能進行蒐集

台灣個資定義

https://i.imgur.com/eOnliu3.png


gdpr跟ccpa是包括但不限於個資

也就是性別年齡所在國家等等都包含在裡面

即使是去識別化的資料也不可以在未經使用者同意的情況下蒐集

gdpr當初在資訊界是很大條的一件事

現在也越來越多國家跟地區跟進資料蒐集的限制

你現在進入各大網站會看到的「同意使用cookie」就是gdpr的成果

※ 引述 《OpenGoodHate》 之銘言:
: 推 qk3380888: 請問要下什麼條件才知道參與者是太陽花 126.236.27.103 05/30 10:27: → qk3380888: 出來的捏 126.236.27.103 05/30 10:27

去識別化有一個很簡單的做法

你的手機給你一個uid

所有上傳的資料都綁定在這個uid上面

而這個uid只會存在你的手機裡

所以伺服器(外部)經由uid關聯到你這個人的路徑是不存在的

由於uid是唯一值

所以可以知道「資料的變化」

而「顧客回頭率」就是其中之一的重要指標

分析報告不需要知道你是誰

只需要知道這兩筆資料是不是屬於「兩個獨立的個體」

也就是說當一個數位的統計資料可以統計「人數」

他就存在一個可以分類資料的標籤

可以是長時間的使用的uid也可以是短暫辨別用的ip位址

否則他就只能統計「資料上傳的次數」

這樣意義就不大了

至於可以知道你去過太陽花也去過青鳥

這個就有點誇張

時間跨度越大去識別化的誤差就會越大

因為uid是隨時都能重新產生的(例如換手機、換門號)

而519跟521、524、528這種短時間內的統計

甚至只需要知道這個uid存不存在兩筆以上的資料就能判斷

是一件下SQL語法就能解決的事情

連程式都不用寫

扯到個資是真的在秀自己的無知

再說一次

沒有要替誰背書

純粹就資訊業的正常資料分析原理做說明

順便看能不能釣到資訊業的潛水鄉民XD

請問著名的「養老機構」是哪間公司?

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.163.22 (臺灣)
PTT 網址

Tosca 05/30 12:14聽到連太陽花都能比對就知道是唬爛啊

Tosca 05/30 12:15十年前的去識別化資料也能比對?!超級黑科技

audi1005 05/30 12:15能比對太陽花不就代表沒去識別化??

nvlsvee 05/30 12:17是被重新識別,個資主體被危害

thirtyto 05/30 12:17唬爛 正常

Mimmature 05/30 12:19去識別化的資料統計時間跨度長的

Mimmature 05/30 12:19得到的可能會是兩邊不重複的結果

Mimmature 05/30 12:19實際上卻可能有重複

Mimmature 05/30 12:19因為uid重新產生而判斷為兩個獨立個體

Mimmature 05/30 12:19所以準確度大幅下降

thirtyto 05/30 12:19跟拿同一份民調 不同人 唬爛 不同結果

Robben 05/30 12:20就拿資料嘴而已

thirtyto 05/30 12:20名嘴 不就做 這工作

fleeaaa 05/30 12:20所以王為什麼不說他唬爛的

thirtyto 05/30 12:21你當然說分析 不然你說 自己唬爛喔

thirtyto 05/30 12:211% 論壇 的各位 都是在分析阿

bbo40453 05/30 12:22藍白根本不會管這些

vsbrm 05/30 12:24結論:憨川唬爛嘴,黨內護航火葬場

bulden 05/30 12:25就通保法而言IP也算個資。

bulden 05/30 12:26當你手機給個UID就算是標注。

bulden 05/30 12:26如果反向查詢對應的手機碼,都不算去識別

bulden 05/30 12:26

whiteflora6 05/30 12:26https://i.imgur.com/LRPrDaH.jpeg

OpenGoodHate 05/30 12:28這太專業小草聽不懂啦

alanjiang 05/30 12:29說自己唬爛會降低公信力啊

alanjiang 05/30 12:29說自己沒唬爛那就會被查到底啦

s9021401045 05/30 12:30那請問王義川是如何知道年齡分佈比

s9021401045 05/30 12:30例跟性別比例的?不同的uid 也能知道

s9021401045 05/30 12:30這些資訊嗎?

thirtyto 05/30 12:30所以 現在是要檢討 資料收集使用

thirtyto 05/30 12:31還是 王 非法監控人民??

thirtyto 05/30 12:31還是 電信業者非法分析 大數據??y

bulden 05/30 12:33https://imgur.com/dhhbNz8

bulden 05/30 12:34https://imgur.com/1ySJUfa

bulden 05/30 12:34看法令,不要只看一條

lazycat5 05/30 12:39謠言:誰說比對太陽花,證據呢?

Mimmature 05/30 12:45去識別化的uid是無法讓你反向查的

Mimmature 05/30 12:45並不是使用者的個人uid

xra686 05/30 12:49小草:說你違反個資就是違法 還敢還嘴喔

xra686 05/30 12:49通通都是護航

Mimmature 05/30 12:50年齡性別這些資料可以跟uid綁在一起

Mimmature 05/30 12:50所以不是王義川知道

Mimmature 05/30 12:50是你當初同意上傳的資料就有包含了

Mimmature 05/30 12:50例如簽署的各種合約裡可能都有提到

Mimmature 05/30 12:50「再行銷」這三個字

Mimmature 05/30 12:50而歐盟要阻擋的就是這類資料蒐集

Mimmature 05/30 12:50台灣目前還沒有 不如說亞洲目前還沒有

thirtyto 05/30 12:50靠邀 真的沒說連接到當時太陽花阿

thirtyto 05/30 12:51是 選前之夜 五月這幾場

trillian 05/30 13:03主要是大兵太扯,連太陽花都能比對

trillian 05/30 13:03這要嘛就是拿到原始資料,要嘛就是唬爛

jung7458 05/30 13:08他的風格就是扯 活該被炎上

v19791119 05/30 13:10誰給他資訊?國安給綠?綠給王?

v19791119 05/30 13:11國安説沒給王,但不代表沒給其他人吧?

v19791119 05/30 13:12不然就是電信給王?

holysong 05/30 13:22國民黨抹黑傳統,公文封存30年,蔡英文

holysong 05/30 13:22的論文,反正就是要搞臭你

xulzj524 05/30 14:01好了啦

xulzj524 05/30 14:01公佈哪間廠商賣的

xulzj524 05/30 14:01大家去買看看就知道是不是藍白翻車了啊

xulzj524 05/30 14:01連廠商都不公布敢說沒問題啊~

xulzj524 05/30 14:02而且都比對好了也有資料了

xulzj524 05/30 14:02這麼好賺的東西廠商還不賺啊

xulzj524 05/30 14:02怎麼不見廠商跳出來說資料我們比對賣的

xulzj524 05/30 14:02想買的趕快找我買

xulzj524 05/30 14:03而且這又不是跟政府的交易

xulzj524 05/30 14:03是一個普通人跟民間公司的交易

xulzj524 05/30 14:03沒有什麼機密問題了吧