Re: [新聞] 監控案鬧大了?于北辰挺王義川怒:電視
問一問GPT就有很詳細的分析方式了
重點在於有沒有去識別化
KMT一堆垃圾文組連大數據分析都不懂
難怪連AI產業都反
PS.懶得把GPT回的內容轉繁中了 請不要用這做文章模糊焦點
-----------------------------------------------------
根据手机信号比对两次活动人流,以确定它们是否属于不同族群,是一个复杂但可行的任务。这个过程涉及数据收集、数据分析和模式识别。
以下是一个概述和步骤,说明如何实现这一目标:
### 1. 数据收集
#### a. 获取手机信号数据
- **来源**: 通过移动通信服务提供商或使用专门的设备(如无线信号扫描仪)获取活动期间的手机信号数据。
- **数据类型**: 每个设备的唯一标识符(例如,IMEI 或 IMSI,但需注意隐私保护),信号强度,时间戳,地理位置等。
### 2. 数据处理
#### a. 数据预处理
- **去重**: 清理重复的信号数据。
- **隐私保护**: 将个人标识符进行匿名化处理,以确保隐私保护。
- **时间和位置同步**: 确保数据的时间和位置信息是同步且准确的。
### 3. 数据分析
#### a. 活动人流模式识别
- **聚类分析**: 使用聚类算法(如 K-means、DBSCAN 等)将手机信号数据按活动区域和时间段进行聚类。
- **频率分析**: 分析不同时间段内出现的设备频率。
#### b. 族群识别
- **特征提取**: 从手机信号数据中提取特征,如出现频率、停留时间、移动路径等。
- **机器学习**: 使用监督学习(如分类算法)或无监督学习(如聚类算法)来识别不同活动期间是否存在显著不同的族群。
### 4. 结果验证
#### a. 比对分析
- **交叉验证**: 比较两次活动的人流数据,通过交叉验证来确定是否为不同族群。
- **相似度计算**: 使用相似度指标(如 Jaccard 相似系数)来量化两次活动人流的相似度或差异度。
### 示例步骤
以下是一个简化的示例脚本,使用 Python 和一些常见的数据科学库(如 pandas、scikit-learn)来处理和分析数据。
```python
import pandas as pd
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import StandardScaler
# 假设我们有两个活动期间的手机信号数据
data1 = pd.read_csv('activity1.csv') # 包含 columns: 'device_id', 'timestamp', 'latitude', 'longitude'
data2 = pd.read_csv('activity2.csv')
# 数据预处理
def preprocess(data):
data = data.drop_duplicates(subset=['device_id', 'timestamp'])
data['coords'] = list(zip(data['latitude'], data['longitude']))
return data
data1 = preprocess(data1)
data2 = preprocess(data2)
# 特征提取
def extract_features(data):
scaler = StandardScaler()
coords = scaler.fit_transform(data[['latitude', 'longitude']])
clustering = DBSCAN(eps=0.1, min_samples=10).fit(coords)
data['cluster'] = clustering.labels_
return data
data1 = extract_features(data1)
data2 = extract_features(data2)
# 比对分析
common_devices = set(data1['device_id']).intersection(set(data2['device_id']))unique_to_data1 = set(data1['device_id']) - common_devices
unique_to_data2 = set(data2['device_id']) - common_devices
print(f"共同出现的设备数量: {len(common_devices)}")
print(f"仅在活动1中出现的设备数量: {len(unique_to_data1)}")
print(f"仅在活动2中出现的设备数量: {len(unique_to_data2)}")
# 输出结果
if len(common_devices) / (len(data1['device_id']) + len(data2['device_id'])) < 0.5:
print("两个活动中的人流属于不同的族群。")
else:
print("两个活动中的人流有较大重叠。")
```
### 注意事项
- **隐私保护**: 在处理个人数据时,必须遵守相关法律法规,确保隐私保护。
- **数据质量**: 确保数据的准确性和完整性,以提高分析结果的可靠性。
- **算法选择**: 根据数据特点选择合适的算法进行分析和建模。
通过这些步骤,你可以对比两次活动的人流数据,判断是否属于不同的族群。根据实际需求,还可以进一步细化和优化分析过程。
--
用簡體字是不會轉繁體嗎?
Device id就他媽的已經是個資了好嗎?
另外要抄你要找套英文的,用中國的code你
是不是中共同路人?
八又翻
記錄你10年的去向,還要護航哦?
Device ID就是廣告ID,有這個就死定了
426滾啦
第一句就…
殘體字
這次的主要爭議點,又不是技術是否可行,
而是擅自使用這種技術是否應當?
好了啦,我小心憨川用膝蓋就能分析。
你有沒有問它如何蒐集這類資料,有
沒有違反我國法規
法律角度 我有一份 黃仁勳的去識別化個資
提供一份(黃仁勳的)去識別化個資 沒違法
目前來看沒違法 cc
提供100份黃仁勳"們"的去識別化個資 更沒
人權會都繳很清楚啦能 串連出 個資就是
違法啊 單筆你不知道誰 沒事 你一做分
析串起來瞬間就個資法
違法 這麼簡單的理解 天下太平
去識別化的個資 就不叫個資嗎? big ?
所以高雄台北都只敢說我們是作量和輪廓
一旦像王舉例台中說作到回頭率什麼都就
是爭議了
台中的重遊率看有沒 正當理由
中共同路人
那麼怕個資外洩最好不要用googleMap
也不要看youtube google都有分析你
一直以來這些數據資料電信公司那本就都會
有,無論是否有去識別;問題是川他只是黨
職欸?可以取得這種級別的資料真的沒有問
題嗎?更何況他還自爆可以比對太陽花了,
10年前欸,你真覺得這是大數據分析可以比
對的喔...
可憐,只有你的是簡中。
你連簡轉繁的能力都沒有,還想笑文組喔
技術可行啊,所以才要搞個資法來保護吧
技術可行 但違法
就是曹操他娘的違法 王義川才在那邊詭辯膝
蓋
連爭議點都搞不清楚 你還是不要出來丟臉
了
笑死
爆
[爆卦] 中國最新演習公告新华社受权公告:中国人民解放军将于北京时间2022年8月4日12时至7日12时,在以下海 域和空域,进行重要军事演训行动,并组织实弹射击。具体为: (来自金十数据App) --75
[雪女] 作者將在Bilibibli進行活動ぷぅ崎ぷぅ奈@新作雪女2発売中 @punopupupu 以前经常从中国的粉丝们那里收到希望能在哔哩哔哩进行活动的呼声,于是这次我就开通 了这个新的账号,今后还请大家多多支持!3
Re: [問卦] 中國怎麼也放任柬埔寨亂搞?其實順道提醒一下 除了柬埔寨 緬甸目前也是有問題的 特別是緬北的瓦邦地區 瓦邦之前還會在中國抖音發講中文的帥哥美女說自己是中國遠征軍的後人4
[閒聊] 原神武器池up亲爱的旅行者,「神铸赋形」活动祈愿即将开启,「法器·不灭月华」「弓·阿莫斯之弓」 概率UP! 活动期间,旅行者可以在「神铸赋形」活动祈愿中获得更多武器与角色,提升队伍的战斗力 ! 〓祈愿时间〓6
Re: [問卦] 讀20年書、還30年房貸、養20年醫院,多嗎?剛查了一下中國的房貸利率 最新數據大概在3.7左右 大概是台灣的兩倍 而且這還是歷史新低 因為房地產快崩盤了 沒人要買5
[情報] 鸚鵡模擬器也被taito告了!這是我在大陸網站看到的翻譯 不知道要陪多少錢? 可能是模擬器連線對戰要付費所以被告? 亲爱的 TeknoParrot 社区, 我们最近遇到了一个重大挑战:来自Taito Corporation的DMCA删除通知,针对我们服务X
Re: [討論] 中共禁日海產 拿石頭砸自己腳你的文章第一次讓我有了回復的衝動 ※ 引述《liweitseng (我不改版標)》之銘言: : 中共國涉外部門戰狼發言人竟然用日本檢測可靠度問題來反對核廢水 禁了日本海產 還鼓 : 動知識不足的支那韭菜瘋狂屯鹽 甚至拒吃海產海鮮 : 滑稽行徑前所未有1
[分享] 棒球數據Stuff+B站up主做的科普 【棒球数据漫谈第12期:球威的定义及球种分析-哔哩哔哩】 想睡了,紀錄一下,有空再來紀錄心得 --X
Re: [問卦] 日本超高疫苗接種率不敵疫情?Source: The Vigilant Fox Dr. Malone:CMV, herpes, shingles, Epstein-Barr virus , these are all laten DNA viruses that are kept in the box by the T function. But data strongly proves that multiple vaccinated recipients have T cell suppression. As a result, they may have immunosuppression,- 男性退休年齡 国家 近期数据 前次数据 参考日期 单位 澳大利亚 67 67 2024-12 年 丹麦 67 67 2024-12 年 希腊 67 67 2024-12 年
爆
[爆卦] 賴清德為霸凌案出面道歉了爆
[爆卦] 中華隊棒球睽違21年 再次贏美國隊!爆
[問卦] 一提到被媒體霸凌大家第一個想到誰?爆
Re: [新聞] 快訊/柯文哲涉「2大案」最快12月偵結爆
[問卦] 人資:「上班偷錄音違反職場倫理」爆
Re: [新聞] 批黃國昌輕放謝宜容!李正皓:勞動部調查爆
[爆卦] 江坤宇 清壘三壘安打爆
Re: [新聞] 爆黃國昌與謝宜容秘密會議 李正皓秀公文爆
[問卦] 道歉影片出來了?86
[爆卦] 潘傑楷 炸裂54
Re: [問卦] 禮拜五謝宜容敢出來道歉 我馬上去割爆
[問卦] 綠同事:第一次有人死掉鬧這麼大爆
Re: [新聞] 為愛赴緬做詐騙!靜宜女大生近期有望回台51
[問卦] 他的死是我的錯 這麼難開口嗎47
[問卦] 美國隊是派那些等級的咖?45
[爆卦] 台灣2:0美國啦32
[問卦] 主管要檢查手機 說是防洩密 要交出去嗎42
[問卦] 有比皇帝還上位的存在嗎?36
[問卦] 台籃打比賽有辦法領先米國爸爸ㄇ31
[爆卦] 台灣得分啦32
[問卦] 打爆美國老爸了31
[問卦] 出事情嚴查嚴辦當事人卻跑了?32
[問卦] 中職有2A~3A水準了吧?31
[問卦] 同樣是政府部門 怎麼有的部門爽到爆?31
[問卦] 海地 是個什麼樣的國家啊?29
[問卦] 美國職棒被台灣打爆22
Re: [問卦] 光榮戰死曝屍泥濘,會比投降好嗎10
[問卦] 領先六分還敢盜壘阿27
[問卦] we care高雄這次怎不出來說話?27
[問卦] 美國這次輸掉的原因?