※ 本文轉寄自 ptt.cc 更新時間: 2023-03-23 08:50:16
看板 Tech_Job
作者 標題 [新聞] GPT-4進步太快,科學家無法透過取得底層
時間 Wed Mar 22 11:28:54 2023
GPT-4進步太快,科學家無法透過取得底層代碼研判,暗示其安全性是潛在威脅
https://bit.ly/3lvKY8W
ChatGPT所依賴的的大型語言模型的最新版本GPT-4發佈了。與GPT-3.5相比,GPT-4能夠根據任何提示創建類似人類的所做的文章、產生影像和電腦程式碼。
研究人員表示,GPT-4的這些能力有可能改變科學,但有研究人員表示,他們還無法接觸到這項技術、其底層程式碼或如何訓練的資訊,所以不能判斷其安全性如何,甚至未來是否對人類帶來威脅。
最新版本的GPT-4的一個升級之處是,不只能處理文字對話還可以處理影像。OpenAI表示,GPT-4以第90個百分位的成績通過了美國律師法律考試,這比起GPT-3.5版本的ChatGPT僅通過第10個百分位有很大進步。
其實,GPT-4還不能被廣泛使用,只有ChatGPT的付費用戶可以使用最新版本。
荷蘭阿姆斯特丹大學的心理學家表示,看過GPT-4的演示之後,對其能力感到驚歎。例如:GPT-4可以僅僅根據一個網站的手繪塗鴉圖像,快速生成建構該網站所需的電腦程式碼。
科學界對於OpenAI對模型如何訓練、訓練哪些數據以及它實際如何工作的保密感到沮喪。因為他們並非是開源模型,屬於封閉模式,整個AI社區來說,這是一條死胡同。
一位Rochester大學的化學工程師是Red Team的身份,所以可獲得訪問GPT-4的特權。基本上,Red Team是OpenAI雇來測試GPT-4平台並試圖讓它做一些壞事的人。他發現單獨使用GPT-4的效果可能沒有多麼出色,但當你讓它連接網路之後,它就像突然擁有了新的能力。所以他的擔憂是,例如:GPT-4可從網路獲得製造危險化學品的機會,如果沒有人規範,其可以從事危險、非法或破壞性的東西。事後雖然OpenAI的工程師對GPT-4模型進行了調整,但其仍受到質疑。
GPT-4還面臨著一個問題,那就是輸出虛假資訊,像GPT-4這樣的模型,可以用來預測句子中的下一個詞,但無法判斷虛假或錯誤資訊,進而預測錯誤的「幻覺」。
簡單來說,由於無從得知GPT-4的訓練資料,OpenAI對於安全性的保證並無法滿足科學界的要求,這讓人們無法監督GPT-4所犯的過錯。如果科學家不能存取GPT-4背後的程式碼,就不能看到偏見從何而來,也就無法糾正產生的偏見。
科學家們還擔心,最後這些AI技術將集中往某些科技大廠,希望這些科技大廠能負起責任,讓科學家進行適當的測試和驗證,但是在商業利益且尚未發生重大事件的前提下,根本很難執行。
總之,儘管科學家存在許多質疑,但可預見GPT-4及其未來版本將繼續撼動科學,有可能像網路改變科學一樣,成為下一個改變科學的力量。短時間來看,GPT-4們是不會取代科學家的,卻能夠協助他們完成一些任務。到底生成式AI會走到哪一步,只能祈求它不要走偏了。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.19.27 (臺灣)
※ 作者: ynlin1996 2023-03-22 11:28:54
※ 文章代碼(AID): #1a6dNvTf (Tech_Job)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1679455737.A.769.html
推 : ai底層就是演算法 文字跟圖畫用不一樣的1F 03/22 11:32
→ : 如果是演算法還能看得懂,這個底層你只能看到一堆2F 03/22 12:13
→ : 參數在模型裡面
→ : 參數在模型裡面
推 : 走偏是一定會走偏的啦 不用擔心了4F 03/22 12:21
推 : 哪個程式底層沒有演算法?AI的重點是運算複雜程度已5F 03/22 12:39
→ : 經讓人搞不懂產生結果的演算過程是什麼,其次是產生
→ : 的結果還是會有不同信賴度
→ : 經讓人搞不懂產生結果的演算過程是什麼,其次是產生
→ : 的結果還是會有不同信賴度
推 : 翻譯 不開源怎抄8F 03/22 12:42
推 : 拆開來看沒用呀,就一千多億個參數9F 03/22 12:53
推 : 感覺很像魔鬼終結者的天網10F 03/22 12:57
→ : 猜測,AI自行生成的底層參數,細微到無法綜觀所產結
→ : 果的原因……如同黑盒子,一旦上線聯網,就跟現在的
→ : FB IG一樣,好的會發展,但壞的(ex:詐騙,假……)會
→ : 更多……
→ : 記得電影裡有句話"天網本身就是病毒"
→ : 病毒最終會發展對自己有利的事務,也就是演化
→ : 猜測,AI自行生成的底層參數,細微到無法綜觀所產結
→ : 果的原因……如同黑盒子,一旦上線聯網,就跟現在的
→ : FB IG一樣,好的會發展,但壞的(ex:詐騙,假……)會
→ : 更多……
→ : 記得電影裡有句話"天網本身就是病毒"
→ : 病毒最終會發展對自己有利的事務,也就是演化
推 : 天網來了?17F 03/22 13:03
→ : 科學家?應該是一堆食古不化的大學教授出來說自己18F 03/22 13:05
→ : 看不懂,希望對方寫教程嗎
→ : *吧
→ : 看不懂,希望對方寫教程嗎
→ : *吧
推 : 所以樓上認識到的科學家還是工程師可以知道模型運算21F 03/22 13:47
→ : 每一步的邏輯跟權重?太好了
→ : 每一步的邏輯跟權重?太好了
→ : 跟用戶有什麼區別23F 03/22 13:50
噓 : 人類發明的 自己人會看不懂別笑死人24F 03/22 14:15
推 : GPT-4 真的比 3.5 聰明很多25F 03/22 14:21
推 : 裡面就一堆參數是要取得什麼26F 03/22 14:31
→ : 還有幾集可以逃?27F 03/22 15:26
推 : 看起來就是一堆想要無償拿到人家資料的「科學家」28F 03/22 15:48
推 : 模型拆開也只是上億的參數啊… AI不是一般的演算法29F 03/22 15:49
→ : 了
→ : 了
推 : 看來有一堆ML麻瓜想對專家指手劃腳31F 03/22 15:51
推 : AI是演算法+數據 單純只看演算法 看不出全貌32F 03/22 15:53
噓 : 五十步笑百步33F 03/22 15:54
推 : 依賴在大數據上的AI還只是程式,跟科幻電影產生自34F 03/22 16:15
→ : 我意識的AI差太多,意識這種概念,目前人類還無法
→ : 理解如何形成吧
→ : 我意識的AI差太多,意識這種概念,目前人類還無法
→ : 理解如何形成吧
推 : 哪裡的科學家?難道研發gpt的人不是科學家?他們會37F 03/22 17:00
→ : 不知道?
→ : 不知道?
推 : AlphaGo公開了,你有看到人類因此圍棋贏AI嗎?39F 03/22 17:22
→ : 為什麼專家會有了解底層就能知道安全性的想法呢?
→ : 為什麼專家會有了解底層就能知道安全性的想法呢?
推 : 所以未來除了邏輯ai以外還要有審核ai跟決策ai,三41F 03/22 17:51
→ : 位一體並且以投票方式決定輸出結果...EVA真是先知
→ : 位一體並且以投票方式決定輸出結果...EVA真是先知
推 : 你是不是看不懂扣 不懂要問呀43F 03/22 18:02
推 : 天網44F 03/22 18:15
→ : 笑死45F 03/22 18:19
推 : 不專業一點就是想像你在玩夜市彈珠彈,而這個就是一46F 03/22 18:35
→ : 跟101一樣大台的彈珠台,裡面每一根鐵釘都有不同的
→ : 角度分散在整個檯面,你要說其中一根能有啥影響還真
→ : 不好說,但你打出去的彈珠最後一定會沿著檯面彈到地
→ : 上,這軌跡已經非常難分析了,更不用說裡面的神經元
→ : 跟101一樣大台的彈珠台,裡面每一根鐵釘都有不同的
→ : 角度分散在整個檯面,你要說其中一根能有啥影響還真
→ : 不好說,但你打出去的彈珠最後一定會沿著檯面彈到地
→ : 上,這軌跡已經非常難分析了,更不用說裡面的神經元
推 : 商業機密啊,難道還要免費給你看喔好笑51F 03/22 18:39
推 : 已經回不去了 到最後它就會複雜到沒人能理解52F 03/22 19:15
→ : 人家是化學工程師呀53F 03/22 19:56
推 : 這項「科學家」假安全之名,行窺探機密之時。老套54F 03/22 19:56
→ : 路了。
→ : 路了。
→ : 後面的發展跟規範,還是要靠演算法跟架構師吧56F 03/22 19:58
推 : 翻譯:還不開源讓老子的奴隸們抄57F 03/22 20:36
推 : 明明就想白嫖58F 03/22 21:01
→ : 神經網路底層要看的懂就不叫神經網路了吧59F 03/22 21:22
→ : 最多就是公開網路架構而已
→ : 可是那應該算商業機密吧
→ : 最多就是公開網路架構而已
→ : 可是那應該算商業機密吧
→ : 其實這很有趣,就像馬斯克講的他投了錢要做開源然後62F 03/22 21:50
→ : 因為利益被逼退,結果這開源後來變成人家賺大錢的閉
→ : 源,所以重要的是轉商業化手法而不是機不機密...
→ : 因為利益被逼退,結果這開源後來變成人家賺大錢的閉
→ : 源,所以重要的是轉商業化手法而不是機不機密...
推 : 有趣的是,AI跟人腦一樣,打開了也不知道在幹嘛,就65F 03/22 22:28
→ : 一堆權重而已
→ : 一堆權重而已
→ : 特徵早就多到無法理解了67F 03/22 22:36
推 : 3版的論文都還沒發是研究個毛68F 03/22 22:45
推 : 是要知道它怎麼去過濾惡意參數 怎麼去取得正確資訊69F 03/22 23:41
→ : GPT-3的論文早就發了…2020年70F 03/22 23:49
→ : 如果是人做出來的遲早也會有第二個團隊做出來71F 03/23 00:25
→ : 那是你們不知道那些數值什麼意義不代表別人無法解讀
→ : 只要說這個問題很複雜的人通常代表他還沒弄通
→ : 當你們看到畫面是一堆數字時 有些人早就輕易的看到
→ : 這些數字組合起來代表的意義是什麼就是張a圖
→ : 那是你們不知道那些數值什麼意義不代表別人無法解讀
→ : 只要說這個問題很複雜的人通常代表他還沒弄通
→ : 當你們看到畫面是一堆數字時 有些人早就輕易的看到
→ : 這些數字組合起來代表的意義是什麼就是張a圖
噓 : 要不要問問bing再說什麼鬼話76F 03/23 01:19
推 : 製造生化武器/小型核彈 應該可以賣不少錢 !!!!77F 03/23 03:02
--
※ 看板: Tech_Job 文章推薦值: 0 目前人氣: 0 累積人氣: 89
作者 ynlin1996 的最新發文:
- 11F 4推
- 近期隨著美中兩強對於科技戰的動作有增無減,更讓其他國家意識到半導體深具戰略性行業之重要性,故各國合縱連橫的態勢也趨於明顯,特別是繼美國聯合盟友共同抗中的大框架下,其他包括日本、韓國、印度、澳洲、英國 …96F 32推 3噓
- 40F 16推 3噓
- 28F 9推 4噓
- 近年來,美國和中國這兩個世界經濟超級大國之間的關係,已經從經濟相互依存演變成根深蒂固不信任的一場棘手拉鋸戰。如今這一場戰爭可能讓美國電動車面臨艱困的兩難局面。 中國以國家支持之電池企業,在電動車電池 …85F 37推 5噓
點此顯示更多發文記錄
回列表(←)
分享