※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2018-10-20 10:22:49
看板 Gossiping
作者 標題 [爆卦] i'Analyseur 的重大問題
時間 Sat Oct 20 06:41:37 2018
現在有很多鄉民/黨工喜歡用i'Analyseur,
來分析/抓出 五毛/黨工....
i'Analyzeur的設計策略基本上是對的,
就是利用ip/登入時間/文章列表來抓出不尋常/異常的行為.
但是裡面的ip紀錄的擷取方法,很明顯是有bug的,
或者是說,有不盡完善的地方.
因為這個bug,大家所看到的ip交叉分析是有對有錯.
可是有對有錯,代表如果大家直接用這個結果來分析,
很容易推導出錯誤的結論.
可是有對有錯,代表如果大家直接用這個結果來分析,
很容易推導出錯誤的結論.
首先,先拿八卦版版主的ip紀錄來看好了
https://www.ianalyseur.org/user/RandyMarsh/
i'Analyseur - User: randymarsh
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur - User: ibakablock
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur - User: jacklyl
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur - User: girl55665566
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur - User: pptplayer
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur - User: rs5566
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
i'Analyseur 是一個PTT分析平台,針對ID或IP提供整合性且視覺化的分析 ...
靠,這幾個人是分身大王啊?
IP遍佈各地,甚至到國外去了.
如果你有這個結論,那你就已經被i'Analyseur的bug給愚弄了.
i'Analyseur的ip紀錄,應該有根據發表文章上的ip/時間,
做為上線ip以及時間的紀錄之一.
但是這個parsing(懶得解釋了)一定是有bug的.
會把一篇文當中引用其他人的文的ip/時間也算進發表人.
"請問要引用原文嗎(Y/N/All/Repost)?[Y] r"
裡面一般的Y引用可能是沒問題的(因為只留文章,且加":"),
但是Repost引用(沒有前置":")會導致,
被引用跟引用者兩人身分的混淆.
這就導致喜歡引用它人發文/發文常常被引用的人,
有機會會混在一起分不出來.
本篇文章中的諸位分身大王,
就是因為常常要開水桶藥單,
必須引用許多文章最為裁決證明,
導致錯誤結果.
結論:
在i'Analyseur的ip紀錄的parsing bug解決,
並將整個資料庫重新更新之前,
最好不要"直接"用它做重大指控,
參考可以,但是下結論之前,
自己最好多動手觀察/紀錄,
確認之後在說吧.
畢竟搞出烏龍被告被酸的時候,
i'Analyseur它也不會幫你扛的.
另外,bug未修之前,有心人想要故意搞亂這個資料庫也是沒問題的.
例如,把我下面那三行前面":"去除,
放到你的文章當中,
你可能就會多了三個有來頭登錄ip了.
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.130.192.150
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.8.116
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.92.207.178
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.6.102.107
※ 文章代碼(AID): #1RobscDT (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1539988902.A.35D.html
→ : 沙發1F 36.239.18.149 台灣 10/20 06:42
推 : 沒差啦..說你網軍就網軍啊...都說了2F 223.140.48.208 台灣 10/20 06:42
→ : 查我自己id..還出來一堆不認識的笑死
→ : 查我自己id..還出來一堆不認識的笑死
→ : 浮動ip阿4F 36.239.18.149 台灣 10/20 06:43
推 : 數據給你你要自己判讀啊 2樓就是看不懂的5F 101.13.6.241 台灣 10/20 06:44
→ : 人XD
→ : 人XD
→ : 創世神認證的阿 黨工很怕吼7F 1.163.119.45 台灣 10/20 06:45
推 : 不認識很正常好嗎,你會知道誰跟你用8F 180.204.10.57 台灣 10/20 06:46
→ : 同ip喔
→ : 同ip喔
推 : 放心 寫這系統的防火牆都堵好了 人家拿來亂10F 36.228.142.210 台灣 10/20 06:46
→ : 搞與他無關
→ : 搞與他無關
推 : 很怕喔 禮拜六早上特地發一篇12F 36.236.105.97 台灣 10/20 06:47
→ : 沒差吧 我看不管是說廠工還是說柯粉13F 72.201.192.249 美國 10/20 06:47
→ : 都沒有人在附證明的啊
→ : 都沒有人在附證明的啊
推 : 還好啦 也只有板主有這狀況15F 128.146.189.92 美國 10/20 06:48
喜歡無":"引用別人發文,跟常常被人無":"引用發文的人,
通通都會中鏢的.
這還不包括故意要搞破壞的人.
推 : 查出用過相同IP->點IP->看時間分析16F 114.37.162.204 台灣 10/20 06:49
總之,就是很有參考價值,不過最好還是得親自好好檢查,
多觀察一下再下結論.
→ : 時間差很遠當然不懷疑, 時間很相近17F 114.37.162.204 台灣 10/20 06:50
→ : 小於1天, 那就很有可能是分身囉
→ : 小於1天, 那就很有可能是分身囉
→ : 所以說你不會看數據啊19F 101.13.6.241 台灣 10/20 06:51
推 : 誰會有那種奇怪的習慣啦...20F 128.146.189.92 美國 10/20 06:52
→ : 你拿到統計數據就直接用嗎? 不修正連丁丁21F 64.85.235.108 美國 10/20 06:59
→ : 的民調都會破五成
→ : 的民調都會破五成
推 : 看不懂先推23F 114.43.6.138 台灣 10/20 07:01
噓 : 那你做一個更好的啊,做不出來就閉嘴24F 36.237.141.216 台灣 10/20 07:02
你玻璃心啊? 我不是說很有參考價值,但是要做重大決定之前,
請自己小心一點,多做複查動作.
其實這個Bug不好解決的,如果你有一點CS背景的話就知道.
推 : 原來如此25F 42.71.141.211 台灣 10/20 07:08
推 : 慘惹 現在領500還要學數據分析 我姆咪QQ26F 122.254.41.209 台灣 10/20 07:13
拜託,整個團隊中有一個人可以就好了,其他人找出問題,然後由那一個比較懂得的人,
去做最後的查驗就好啊....
推 : CS 不好解決,那你一定是選錯地圖了!27F 123.194.133.150 台灣 10/20 07:20
推 : 這個bug要修的話 文章網址前一行跟之後的28F 123.193.39.67 台灣 10/20 07:20
推 : 三小心態啊 臭嘴29F 223.137.139.17 台灣 10/20 07:20
→ : 才算是作者IP應該能解決吧30F 123.193.39.67 台灣 10/20 07:20
這防不了有心搞破壞的人...因為這是文字檔,發表以後可以任意修改的.
更不用說,發表前的內容就可以製造兩難了.
→ : 只是對會刪網址又會亂引的又是個新的問題31F 123.193.39.67 台灣 10/20 07:22
推 : 從文章底部往回抓 不過遇到修文補充的也會32F 36.228.142.210 台灣 10/20 07:25
→ : 破功
就說這其實是一個很難修的問題啊..╮(﹋﹏﹌)╭..→ : 破功
推 : IP parsing有心要去弄的話真的無解34F 172.58.109.54 美國 10/20 07:31
→ : 但我覺得這種人應該不多就是了
牽扯到重大利害關係的時候,→ : 但我覺得這種人應該不多就是了
就很有可能會出現有心人.
殺人都有可能了,更何況只是簡單的蓄意誤導?
因為要騙的對象是程式,不是人.
推 : 一般的parsing加上把不合常規的修文抓出來36F 123.193.39.67 台灣 10/20 07:34
→ : 多少能避免有人去規避掉IP吧
→ : 只是這樣還是不能解決直接修發表IP的問題
※ 編輯: hancel (24.6.102.107), 10/20/2018 07:48:44→ : 多少能避免有人去規避掉IP吧
→ : 只是這樣還是不能解決直接修發表IP的問題
推 : 我光是非常確定是XDDDDDDDDDD的分身ID為39F 112.104.113.45 台灣 10/20 07:59
→ : j0958322080都抓不出來了 就知道超沒用
→ : 而且資料庫好一陣子沒更新了的樣子
→ : j0958322080都抓不出來了 就知道超沒用
→ : 而且資料庫好一陣子沒更新了的樣子
推 : 如果是這樣,真的是嚴重bug42F 36.239.87.121 台灣 10/20 08:08
推 : bug修就好了 沒什麽43F 1.164.146.106 台灣 10/20 08:27
推 : 反正說人黨工又不用證據,沒差44F 61.219.191.4 台灣 10/20 08:29
推 : 反正那作者也是做出來,貼圖講別人黨工45F 220.134.101.115 台灣 10/20 08:36
噓 : 昨天才有人爆料候選人的多重影分身46F 42.77.207.111 台灣 10/20 08:42
→ : 今天就一篇這個網站有重大瑕疵
→ : 今天就一篇這個網站有重大瑕疵
推 : 推48F 223.139.49.213 台灣 10/20 08:52
推 : 可是這個瑕疵真的超大啊,如果黨工蓄意49F 111.82.95.18 台灣 10/20 08:54
→ : 要回避的話還真的無法可管
→ : 要回避的話還真的無法可管
推 : 這個網站只是參考用的工具,最主要還51F 61.223.2.223 台灣 10/20 09:18
→ : 是要學會自我判斷
→ : 是要學會自我判斷
推 : 原來如此。53F 223.137.224.203 台灣 10/20 09:44
推 : 你網軍54F 111.82.162.88 台灣 10/20 09:48
→ : 還一堆腦殘文組狂甲拿這個沾沾自喜55F 223.140.76.130 台灣 10/20 09:48
→ : 真是不忍唏噓
→ : 真是不忍唏噓
推 : 誰屌你啊 網軍啾4網軍57F 1.171.154.242 台灣 10/20 10:08
推 : 你可以寄信給他顆顆58F 114.136.158.165 台灣 10/20 10:12
推 : 高調推59F 122.117.178.120 台灣 10/20 10:13
--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 723
回列表(←)
分享