作者 SkankHunt42 (凱子爸)
標題 Re: [情報] 推特將強制所有圖文無償用於AI訓練
時間 Thu Oct 17 16:34:46 2024


※ 引述《wvookevp (ushiromiya)》之銘言:
: 忽然想到
: 如果改天
: PTT將強制所有推文無償用於AI訓練
: 最後訓練出來的帳號推文會是什麼模樣?
: 有沒有希洽?

中國有人試過類似的事情了

不過他們拿來訓練的 是一個叫弱智吧的貼吧(討論板)


https://www.youtube.com/watch?v=ghLCJRTAlMA


相關的研究方法後來還被發表成了論文 可以搜尋ruozhiba

總之弱智吧不管初衷為何 後來逐漸演變成一種幽默的笑話板

但前提是你電波能對得上


如果要拿PTT的資料來做訓練 實際上是會有雜訊的

因為PTT的呈現方式 你要能夠辨識出是哪些板友在底下討論

這種前後文的關係梳理 本來就需要繁雜的預處理


弱智吧本身的灌水量不低 所以就算是資料集也是透過指標篩選或人為推薦的

PTT的狀況是 一篇爆文底下可能80%的推文都是一樣的

這樣的訓練資料並沒有太大意義

除非你今天是要訓練專門推噓文的空軍

那針對特定議題或關鍵字直接膝反射推噓 那是沒問題

而且我相信 已經有人在這麼幹了

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 89.187.161.5 (日本)
※ 作者: SkankHunt42 2024-10-17 16:34:46
※ 文章代碼(AID): #1d4CmefL (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1729154088.A.A55.html
a123444556: 你最後一段不要講這麼隱晦 勇敢說出來4-111F 10/17 16:36
Ardve: PTT可以直接一個滾一個噓結束推文,那種討論版回文得有點意義,所以偶爾能看到觸發關鍵字跑出來亂噴東西的迷途AI w2F 10/17 16:36
dklash: 針對關鍵字的話 訓練模型根本浪費錢 給幾個推文範本
排列組合一下 觸發關鍵字就隨機套用一個去推文就好4F 10/17 16:41
rabbithouse: 想起來前陣子的台灣獨立遊戲,直接觸動機器人敏感神6F 10/17 16:46
snowpoint: 用台灣獨立遊戲戳AI真的滿好笑的8F 10/17 16:52
Pep5iC05893: 台灣獨立遊戲招誰惹誰了9F 10/17 17:17

--
作者 SkankHunt42 的最新發文:
點此顯示更多發文記錄