PTT評價

Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud

看板MobileComm標題Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud作者
vi000246
(Vi)
時間推噓 3 推:3 噓:0 →:41

我只能說不管怎樣 他們一定會侵犯隱私

人工審核照片的

如果是我來設計抓未成年影像的AI

我會先判斷年齡,用臉或是體形,判斷是否為未成年

再判斷圖片是否有裸露,性行為

當符合的特徵越多,就越有可能是未成年色情

你用hash抓到,當然毫無疑問,不需人工審核就知道是犯罪圖片

但未成年色情不只有那些已存在的,可以用hash辨識

還有新拍攝的,需要靠AI找出來的

像我上面講的,越多符合特徵的圖片篩出來,

再經由人工審核才有辨法判斷是否違法

hash是一種低效率手段,光是整理資料庫就是大工程

更別說數千萬計的圖片都要一張一張掃過,這個只能偶爾排程跑一次

或是先用AI抓出可疑圖片,再用hash掃過,

掃不到再交給人工審核

這樣才能縮小範圍,快速抓到違法圖片

我只能說雲端相簿都是沒隱私的

會怕的人可以把照片zip起來再丟雲端

或是自架NAS,自己的資料自己管


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.26.40.120 (臺灣)
PTT 網址

jason264166808/08 01:39你在上傳圖片的時候就會算 hash 值記在資料庫了...

jason264166808/08 01:40你傳上去的圖片hash值又不會變 = =

jason264166808/08 01:42如果你有看過大公司 Storage System 的 paper 的話

jason264166808/08 01:42基本上都會存 data 的 sha-1

vi000246 08/08 01:55我說的是色情圖片的資料庫 每張圖都要loop這資料庫

vi000246 08/08 01:56一次吧

jason264166808/08 01:57Apple 現在的作法就是在你手機丟個 hash 資料庫

jason264166808/08 01:57你手機晶片都能運算的檢查 你覺得這樣會沒效率嗎

jason264166808/08 02:00現代資料庫也不會用 loop 一個一個比對

jason264166808/08 02:00你的想法是 hash 比對這件事情是 O(N) N=資料筆數

jason264166808/08 02:00可是實際上資料庫不是這樣運作的

jason264166808/08 02:02資料庫不要太大的話 比對的效率可以趨近於 O(1)

jason264166808/08 02:03你如果有興趣可以看一下 HashMap 跟 B-Tree

jason264166808/08 02:03PS B-Tree 不是 O(1)

jason264166808/08 02:05這也不算現代了 幾乎都是二三十年前就有的東西

jason264166808/08 02:05現在都是在這上面做優化 所以肯定查的速度更快

vi000246 08/08 02:06可是根據我逛過暗網看過的東西 應該不會是O(1)

jason264166808/08 02:08這不用暗網啊 資工大二的資料結構就有教了 = =

jason264166808/08 02:09資料結構是必修課 算是資工系的常識吧

jason264166808/08 02:13https://i.imgur.com/NS9fpbe.png

jason264166808/08 02:13你可以不信我 但你要信一下 Google

s25g5d4 08/08 02:14其實我覺得非蘋果員工在那邊幫蘋果擔心運算資源不足

s25g5d4 08/08 02:14還蠻有趣的

trywish 08/08 21:11抓有兩種方式,兩種都對,一種的確是FBI資料庫,但

trywish 08/08 21:12另一種就是FB那種方式,偵測後自動判斷,連泳裝都能

trywish 08/08 21:12被當猥褻照片,只要多加幾個參數,就是原PO講的人工

trywish 08/08 21:13審核,至於蘋果要用哪種沒講,也應該不會講。所以考

trywish 08/08 21:13慮隱私,兩種加總才是答案,這也就是為什麼說,別用

trywish 08/08 21:14手機拍小孩,這也不是危言聳聽,想拍小孩記得買相機

trywish 08/08 21:15另外運算資源?FB雖很不穩,但有聽過是因為運算太兇

trywish 08/08 21:15出包嗎?中國那種審更兇地也都沒問題,不用你擔心啦

trywish 08/08 21:25喔,原文有講犯罪資料庫喔。但還是老話,別太相信那

trywish 08/08 21:25些人講法,今天他們不注重隱私,未來也不可能注重,

trywish 08/08 21:26像google已經好幾起抓好幾年前的人了,他們改變政策

trywish 08/08 21:27的話,被抓也不意外,雲端基本上沒隱私可言,不管哪

trywish 08/08 21:27個國家都一樣,而且別以為只有這類犯罪,版權物也一

trywish 08/08 21:28樣,放上雲端最好還是加密,不然你用10幾年帳號被凍

trywish 08/08 21:28就欲哭無淚了。

a1234567289 08/09 11:42相似度搜尋並不是純hashmap的O(1)複雜度喔。詳情可

a1234567289 08/09 11:42以搜An optimal Algorithm for Approximate Nearest

a1234567289 08/09 11:42 Neighbor Searching in Fixed Dimensions這篇論文

a1234567289 08/09 11:43hashmap適用的條件是找物件“本身“ 但這裡的功能是

a1234567289 08/09 11:43在做相似度的尋找

a1234567289 08/09 11:50使用k-d樹的話找相似度的複雜度是O(log N)