作者 bulden (要死的生魚片)
標題 Re: [新聞] 藍攻用國家機器監控人民 王義川貼「台中
時間 Thu May 30 12:10:51 2024


※ 引述《d8751102 (YO~多重影分身之術~Y)》之銘言:
: 1.媒體來源:TVBS
: 2.記者署名: 記者 吳紹瑜 報導
: 3.完整新聞標題:
: 藍攻用國家機器監控人民 王義川貼「台中景點人流分析」反擊
: 4.完整新聞內文:
: 民進黨政策會執行長王義川日前在電視節目分析青鳥運動參與者年齡,被國民黨不斷指控
: 以國家機器比對個資、監控人民。王義川昨(29日)深夜在Threads發文附上3張圖,直說
: ,「歡迎大家來台中玩。」根據圖中顯示,內有台中市政府觀光旅遊局分析的遊客行為,
: 包括男女占比、年齡層占比、重遊率、留宿點、停留時間等資訊。

我是不知道他一直在拗什麼?

重點是,是那一家電信公司幫你做這件事?你說出來就解套了。

: 根據該網站說明,台中市政府觀光旅遊局針對台中市主要遊憩據點,建構此網站,藉由去
: 識別化的電信數據人流統計、科學推估,提供遊憩據點遊客統計資訊,方便使用者即時掌
: 握總體遊客行為特性。
: 該網站指出,可配合時間或空間思考維度,即時查詢台中市當前或特定期間之歷史遊憩數
: 據,產製15項指標之視覺化圖表,包含月遊客數總計、本外縣市遊客數總計、客層居住地
: 來源、客層性別、客層年齡、客層喜好度、客層國籍別、月平假日平均分時人數、平均停
: 留時間、平均連續停留天數、重遊率、留宿點、景點留宿率、旅次鏈、熱力圖及遊客數位
: 足跡等,並依據功能屬性,分眾提供 產、官、學界等領域之業務所需使用。

我們來聊聊一般資料庫在處理這些資料時,怎麼做到真的去個資層及去識別化的。

一般我們的手機,只要進入某一特定區域和當地的基地台進行授信交握時,大概會授信

幾項資料。

比如手機在基地台登入時,資料流大概如下:

       手機門號:IMEI:姓別:出生年月日:居住地:通訊模組MAC:GPS:登入時間:登出時間

數據化:F8:E2:A1:D3:A3:F8:B3:09:57


如果比較有良心的電信公司要賣這些資料串時,應該會先把上述的資料去識別化。

將涉及個資的欄位直接拿掉,比如手機門號:IMEI:通訊模組MAC:GPS

然後保留姓別:出生年月日:居住地:登入時間:登出時間這些!

而將某特定時間內的資料再匯出成一個新母體,而這個母體的單筆欄位可能如下:

遊客1:姓別:出生年月日:居住地:登入時間:登出時間( A1:D3:A3:09:57)

那如果是這些資料,我們就可以透過演算法,去統計分析出這些數據。

月遊客數總計 :統計非台中巿居住地人流。

本外縣市遊客數總計:統計非台中巿居住地人流、

客層居住來源:統計居住地

客層性別:統計姓別

客層年齡:統計年齡

客層喜好度:統計各區熱點流量。

客層國籍別:統計國籍。

月平假日平均分時人數:對平時和假日分析熱點流量。

平均留時間:分析登入登出時間。

平均連續停留天數:分析母體就假日和平日的訊號數量差異。

重遊率:分析熱點流量。

留宿點:分析特定區域的電訊登入登出的時間點。

景點留宿率:分析特定區域的電訊登入登出的時間點加入比對流量。

當然本魯這種只修過基礎資料結構的,就可以利用去識別化,去個資化的方式進行統計分

析了。


那請王義川,找幾個懂資訊或是AI的,可否就上述的資料去對不同時間點和不同區域的

人流對比差異化?

不要再拿台中或新北案例來拗了,你一定是要比對GPS訊號或是手機號碼或IMEI,才比對

出其中是否重覆出現在不同地域和不同時間點。


: 民進黨發言人吳崢昨也強調, 王義川基於綜合現場、網路資訊、問卷調查等資料,事後
: 進行的媒體分析評論,判斷5月24日的群眾與5月19日、民進黨選前之夜的群眾是不同類型
: 的一批人,無涉個資。
: 5.完整新聞連結
: https://news.tvbs.com.tw/politics/2501906
: 6.備註:
: 藍白能你不能

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.249.211.103 (臺灣)
※ 作者: bulden 2024-05-30 12:10:51
※ 文章代碼(AID): #1cL_nD67 (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1717042253.A.187.html
※ 同主題文章:
Re: [新聞] 藍攻用國家機器監控人民 王義川貼「台中景點人流分析」反擊
05-30 12:10 bulden
garry5566: 說實話,他們又不是在和有腦袋的人喊1F 101.12.102.125 台灣 05/30 12:12
noway: 其實就是資料交叉比對而已 所以他必須要有3F 1.200.15.116 台灣 05/30 12:12
u9001101: 專業 推4F 114.136.240.208 台灣 05/30 12:13
devidevi: 他們又不是要講給你聽5F 49.159.219.21 台灣 05/30 12:13
noway: 不只一個的橫向機構提供資料6F 1.200.15.116 台灣 05/30 12:13
就現在的AI處理,可以多項社群媒體去進行分析比對。
※ 編輯: bulden (60.249.211.103 臺灣), 05/30/2024 12:13:59
noway: 而且這些比對辨識工作不是一個人做得到的7F 1.200.15.116 台灣 05/30 12:14
killverybig: 合法爲什麼要提供哪一家?8F 223.140.136.15 台灣 05/30 12:14

合法嗎?

請問如何做到不可逆的去識別化?

devidevi: 我只要把該手機去過519標註小草9F 49.159.219.21 台灣 05/30 12:14
※ 編輯: bulden (60.249.211.103 臺灣), 05/30/2024 12:15:05
devidevi: 我不用該手機原始資料也交叉分析10F 49.159.219.21 台灣 05/30 12:14
Alieno: 合法才要提供阿 喜咧工三小...11F 61.228.191.45 台灣 05/30 12:14
libraayu: 大數據交叉比對也不太可能識別是否同一12F 101.12.178.16 台灣 05/30 12:14
wchad: 你覺得他是在要演給誰看呢?13F 27.52.67.88 台灣 05/30 12:14
libraayu: 群人14F 101.12.178.16 台灣 05/30 12:14
devidevi: 標註小草的這個行為本身就不是去識別化15F 49.159.219.21 台灣 05/30 12:15
garry5566: 517和青鳥,只有比對性別年齡分佈,他就可以說不同一群人16F 101.12.102.125 台灣 05/30 12:15

你拿去問你的統計老師,這樣比對的可信度有多高。

你還不去爻杯?

libraayu: 一定牽涉到imei或是手機號等可供辨別的資料18F 101.12.178.16 台灣 05/30 12:15
※ 編輯: bulden (60.249.211.103 臺灣), 05/30/2024 12:17:25
noway: 他的辨識可以設條件推論啦 例如去519
沒去小鳥遊行 或是類似的方式用行為學判斷20F 1.200.15.116 台灣 05/30 12:16

你一定要標示才能這樣子做丫!

你只要做了標示,就不算是去識別化了,就通保法和個資法都不容許你這樣子做。

devidevi: 條件推論的前提必須針對每個訊號做標記22F 49.159.219.21 台灣 05/30 12:16
noway: 但是這種方式要足夠的資料庫供比對23F 1.200.15.116 台灣 05/30 12:17
garry5566: 他不用做到很精準的推論啊24F 101.12.102.125 台灣 05/30 12:17
GLung: 得意忘形自爆的案例又一個25F 223.137.101.245 台灣 05/30 12:17
※ 編輯: bulden (60.249.211.103 臺灣), 05/30/2024 12:19:19
noway: 不精準做這些事就完全沒意義了26F 1.200.15.116 台灣 05/30 12:17
ronga: 要標示需要電話不然就是IMEI
這就已經是識別化了27F 210.61.66.43 台灣 05/30 12:18
oread168: 那他就是豪小 如果不是豪小就丸子29F 36.235.135.224 台灣 05/30 12:18
garry5566: 除非有內部人提供訊息,不然這些東西30F 101.12.102.125 台灣 05/30 12:18
coffee112: 這種東西可以亂給亂賣嗎 感覺牽連很大31F 220.142.93.47 台灣 05/30 12:18
garry5566: 打不死他,他拗的過去
他現在需要的是一個合法的說法,不需要意義32F 101.12.102.125 台灣 05/30 12:18
devidevi: 民進黨不需要合法說法35F 49.159.219.21 台灣 05/30 12:19
STi2011: 搶救王義川36F 59.125.79.58 台灣 05/30 12:20
ronga: 其實他只要說我唬爛的  或我搞錯了 就解套37F 210.61.66.43 台灣 05/30 12:20
devidevi: 看看黃國昌索資就知道,高市府:已上傳然後就吵不起來了38F 49.159.219.21 台灣 05/30 12:20
askey: 標示就踩雷了啊40F 125.224.87.64 台灣 05/30 12:20
taxi69: 推,土城望川41F 140.112.162.211 台灣 05/30 12:20

--
作者 bulden 的最新發文:
點此顯示更多發文記錄