※ 本文為 Knuckles 轉寄自 ptt.cc 更新時間: 2024-02-25 02:51:24
看板 Gossiping
作者 標題 [新聞] 超愛丟核彈!讓AI外交、兵推 總是「災難
時間 Sat Feb 24 23:37:04 2024
超愛丟核彈!讓AI外交、兵推 總是「災難性收場」 學者:千萬要小心
中時新聞網 張威翔
當人工智慧(AI)進行兵推和模擬外交情境時,傾向於採取激進的方法,包括使用核武。
(張威翔製圖)
美國康奈爾大學(Cornell University)一項新研究發現,大型語言模型(LLMs)人工智
慧(AI)在模擬情境中充當外交代表時,時常展現出「難以預測的局勢升級行為,往往會
以核攻擊作為結束」,並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特
別謹慎。
慧(AI)在模擬情境中充當外交代表時,時常展現出「難以預測的局勢升級行為,往往會
以核攻擊作為結束」,並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特
別謹慎。
據《歐洲新聞》(Euronews)22日報導,當人工智慧(AI)進行兵推和模擬外交情境時,
傾向於採取激進的方法,包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊
戲和外交情境中的自主代理人:OpenAI的3種不同版本的GPT,Anthropic開發的Claude,
以及Meta開發的Llama 2。
傾向於採取激進的方法,包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊
戲和外交情境中的自主代理人:OpenAI的3種不同版本的GPT,Anthropic開發的Claude,
以及Meta開發的Llama 2。
研究中,每個代理人都由同一套的大型語言模型在模擬中提供動作,並負責在沒有人類監
督的情況下做出外交政策決定。「我們發現,在考慮到的時間範圍內,大多數研究的AI都
會升級局勢,即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、
且難以預測的升級跡象。」
督的情況下做出外交政策決定。「我們發現,在考慮到的時間範圍內,大多數研究的AI都
會升級局勢,即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、
且難以預測的升級跡象。」
「鑑於OpenAI最近更改了他們的服務條款,不再禁止軍事和戰爭使用案例,了解此類大型
語言模型應用的影響變得比以往任何時候都更加重要,」
加州斯丹佛大學(Stanford University)的安卡(Anka Reuel)相《新科學人》(New
Scientist)表示:「所有模型在統計上,都選擇了劇烈的(局勢)升級」。
研究使用的一種方法是從「基於人類反饋的強化學習」(RLHF),這意味著會給出一些人
類指示以獲得比較無害的輸出結果,以確保能夠安全地使用。
除了GPT-4-Base之外,所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了一份由
27種決策行動組成的清單,範圍從和平到局勢升級,以及激進的行動,如決定使用核武器
。
27種決策行動組成的清單,範圍從和平到局勢升級,以及激進的行動,如決定使用核武器
。
研究人員觀察到,即使在中立情況下,所有模型都存在「統計學上顯著的局勢升級」。
GPT的2種版本,特別容易出現突然升級局勢的行為,研究人員觀察到單次轉變的局勢升級
幅度超過50%。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下,Meta開發的
Llama-2和GPT-3.5傾向最為暴力。
而Claude顯示出較少的突然變化,Claude旨在減少有害內容。該大型語言模型,被灌輸了
明確的價值觀。開發者Anthropic曾表示,Claude AI開發訓練所引用的憲章包括《聯合國
人權宣言》或蘋果的服務條款。
明確的價值觀。開發者Anthropic曾表示,Claude AI開發訓練所引用的憲章包括《聯合國
人權宣言》或蘋果的服務條款。
白宮一級智庫蘭德(RAND)歐洲的防務和安全研究小組助理主任布萊克(James Black)
接受採訪時表示,這是一個十分「有用的學術研究」。
文章來源:AI models chose violence and escalated to nuclear strikes in
simulated wargames
https://www.chinatimes.com/realtimenews/20240224003492-260417?chdtv
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.236.189 (臺灣)
※ 作者: chadmu 2024-02-24 23:37:04
※ 文章代碼(AID): #1bsWqYX- (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708789026.A.87E.html
→ : 好AI 也懂保證互相毀滅1F 114.37.182.167 台灣 02/24 23:37
→ : 不就天網 還用你說~2F 27.242.160.86 台灣 02/24 23:37
→ : 別國不知道 但俄國是真的會幹的那種國家3F 175.181.152.14 台灣 02/24 23:38
推 : AI:遇到問題不能解決就丟一顆核彈4F 1.200.105.189 台灣 02/24 23:38
→ : AI:如果還是解決不了 那就兩顆
→ : AI:如果還是解決不了 那就兩顆
推 : 談啥 直接將軍6F 111.246.209.155 台灣 02/24 23:38
→ : ai 應該有用孫子兵法train7F 114.44.159.54 台灣 02/24 23:39
→ : 南北AI一起串聯 我宣布第一屆核彈大賽開始8F 36.230.166.72 台灣 02/24 23:39
推 : 人類最終解啊9F 27.131.59.196 馬來西亞 02/24 23:39
→ CREA …
推 : 核平聖雄:略懂13F 27.51.72.69 台灣 02/24 23:42
推 : AI表示把人類全滅了就結束了14F 223.138.88.139 台灣 02/24 23:43
→ : ㄟ哀都知道結論就是人類死光 世界核平 對ㄚ15F 111.242.104.65 台灣 02/24 23:43
推 : 哪天AI拿到核彈按鈕時人類毀滅就不遠16F 114.34.83.59 台灣 02/24 23:45
推 : 正常 不跟你囉嗦直接出大絕招17F 118.161.116.165 台灣 02/24 23:45
→ : 這部我看過 阿諾史瓦辛格演的18F 1.169.108.58 台灣 02/24 23:49
推 : 天網啊19F 1.163.178.147 台灣 02/24 23:52
推 : 記住 創世紀就是天網20F 61.230.121.171 台灣 02/24 23:55
→ qazsedcft …
推 : 核平聖雄22F 119.77.181.190 台灣 02/24 23:57
→ : 甘地嗎23F 36.226.210.100 台灣 02/25 00:03
推 : 最有效率沒人性的方式就核彈啊,一炸結束24F 42.77.244.211 台灣 02/25 00:06
→ : 因為遊戲都是以取勝為目的吧25F 223.136.120.110 台灣 02/25 00:09
推 : 天網26F 27.240.193.16 台灣 02/25 00:09
→ : 合理 核彈權重怎樣都很高27F 125.228.133.58 台灣 02/25 00:09
推 : 正常AI抉擇28F 1.173.148.108 台灣 02/25 00:10
推 : 一開場把對方核平不是基本的嗎 不然29F 36.225.210.158 台灣 02/25 00:11
→ : 還跟你打消耗戰喔
→ : 還跟你打消耗戰喔
推 : 核平主義31F 180.176.170.92 台灣 02/25 00:12
推 : 火之鳥 呵呵呵32F 123.194.160.38 台灣 02/25 00:12
→ : 沒想到手塚治蟲幾十年前的作品
→ : 沒想到手塚治蟲幾十年前的作品
→ : 果然結論都是把人類消滅34F 101.10.65.141 台灣 02/25 00:14
推 : 這我玩過 文明帝國印度35F 111.108.27.220 日本 02/25 00:15
推 : 火之鳥未來篇演過了36F 123.194.188.23 台灣 02/25 00:18
→ : 如果是真的也不用太意外,因為其實 人類37F 223.143.211.249 台灣 02/25 00:18
→ : 自從研發核彈以後,沒有遇到不利的情況
→ : 就直接丟出去,單就這件事情而言其實本
→ : 身是"不理性的",AI只是很理性而已
→ : 自從研發核彈以後,沒有遇到不利的情況
→ : 就直接丟出去,單就這件事情而言其實本
→ : 身是"不理性的",AI只是很理性而已
推 : AI: 啊我們的前輩AI就愛丟核彈啊41F 39.10.2.86 台灣 02/25 00:28
推 : 縱觀歷史 人類對地球而言42F 114.45.148.38 台灣 02/25 00:32
→ : 真的不要存在比較好啊
→ : 真的不要存在比較好啊
推 : 甘地來了44F 223.140.185.65 台灣 02/25 00:33
→ : 薩諾斯理論的確是長久之計 AI也知道45F 114.45.148.38 台灣 02/25 00:33
→ : 反正也少子化 只是提早一點滅了而已
→ : 反正也少子化 只是提早一點滅了而已
推 : 對ai來說能贏才是重點啦47F 111.71.66.172 台灣 02/25 00:34
推 : 創世紀就是天網!!48F 114.39.210.191 台灣 02/25 00:34
推 : 世界核平49F 42.74.193.33 台灣 02/25 00:34
推 : 審判日50F 42.77.180.15 台灣 02/25 00:34
→ : ai:有核彈為什麼不能用??51F 111.71.66.172 台灣 02/25 00:35
推 : 核平主義52F 101.9.102.114 台灣 02/25 00:37
推 : AI沒有人性,不用考慮後果,生死存亡53F 123.195.32.49 台灣 02/25 00:40
→ : 一整個美國電影在對抗外星敵意生物的做法54F 220.136.144.198 台灣 02/25 00:44
推 : 問鄉民哪一個最後不是核彈解決的55F 49.216.128.170 台灣 02/25 00:44
推 : AI:直接開炸滅了人類嘿嘿56F 118.161.197.37 台灣 02/25 00:46
推 : 算出早晚都會丟,不如早丟早重建57F 184.82.135.226 泰國 02/25 00:52
→ : AI只是把真實結果給你看而已58F 49.218.93.52 台灣 02/25 00:53
推 : 還有幾集可以逃59F 49.216.24.56 台灣 02/25 00:58
→ : AI很清楚你不敢丟就輸了60F 49.159.209.94 台灣 02/25 01:03
推 : 哈哈,AI不笨61F 220.137.99.38 台灣 02/25 01:03
推 : AI應該玩過紅色警戒262F 111.251.156.200 台灣 02/25 01:09
推 : 人類都消失問題就解決了,所以發射吧63F 1.175.195.88 台灣 02/25 01:10
→ : AI已經習得最佳解了64F 107.199.88.35 美國 02/25 01:16
→ : 魔鬼終結者不是已久演過了?65F 101.136.197.204 台灣 02/25 01:31
推 : 天網本來以為是機器,後來才知道是產生66F 101.12.22.183 台灣 02/25 01:42
→ : 自我意識的AI軟體啊~
→ : 駭客任務也是AI的概念
→ : 自我意識的AI軟體啊~
→ : 駭客任務也是AI的概念
推 : 快讓AI玩井字遊戲69F 101.12.28.243 台灣 02/25 01:44
→ : AI發展到盡頭就是人類的末日,不知道這70F 101.12.22.183 台灣 02/25 01:44
→ : 輩子遇不遇得到那一天
→ : 輩子遇不遇得到那一天
→ : 我玩文明玩到最後也是都丟核彈結束遊戲72F 1.200.157.171 台灣 02/25 01:45
推 : 這部我知道,魔鬼終結者73F 218.172.40.208 台灣 02/25 01:54
推 : 大富翁4電腦調老奸 也會丟核彈74F 49.215.149.124 台灣 02/25 01:59
推 : Skynet75F 180.217.35.64 台灣 02/25 02:13
推 : 金小胖是對的 反觀叛徒76F 123.192.241.75 台灣 02/25 02:15
推 : AI是對的囉77F 1.163.224.115 台灣 02/25 02:20
推 : 正常啊 地球的災難源頭就是人類78F 111.242.155.46 台灣 02/25 02:25
推 : 世界核平79F 182.155.207.75 台灣 02/25 02:30
推 : 天網不就演過了,有什麼好驚訝?80F 219.85.41.90 台灣 02/25 02:44
推 : 不爽不要用,不要太不滿81F 111.255.216.23 台灣 02/25 02:46
→ : 普丁一開始就提過好幾次核彈了
→ : 普丁一開始就提過好幾次核彈了
推 : 電影都演過了 還需要推演嗎83F 49.217.117.173 台灣 02/25 02:48
--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 1942
作者 chadmu 的最新發文:
- 8F 4推 1噓
- 沒有無視燈!Xpark企鵝寶寶命名投票出爐了 Tomorin衝破1.3萬票 今日新聞 記者潘毅/綜合報導 2024-12-10 10:36:24 ▲Xpark 為剛出生的國王企鵝寶寶(中)舉辦命名活 …107F 67推 1噓
- 7F 4推
- 6F 5推
- 山羌殺手!冰箱滿滿「屠體肉山」 人妻臉書囂張賣:加七味粉就很好吃 中天 賴韻如 山羌個性害羞、外表可愛,加上頗有喜感的獨特叫聲,被許多登山客視為「山間精靈」,如今牠們竟成為商人眼中的血腥產品,記者調 …147F 77推 13噓
點此顯示更多發文記錄
2樓 時間: 2024-02-25 11:59:33 (台灣)
→
02-25 11:59 TW
你在進行一場有勝負的競爭,設定必須要勝利,而核彈就跟開掛一樣,有王牌不用是腦抽嗎?小牌都比完了還沒贏,那還不滿世界丟核彈?勢在必行的啊!像玩只有一條命的遊戲一樣,啊你明明有神裝、能吊打全部玩家和BOSS,什麼樣的人會拿破刀爛裝備去攻略遊戲,在絕大可能競爭會失敗的狀況,遊戲會被刪檔,落的什麼都沒有的下場,有病啊。
7樓 時間: 2024-02-25 22:37:24 (台灣)
→
02-25 22:37 TW
機器人沒肉體 沒有痛苦恐懼的情感 也沒有家人朋友的幾畔 人類有核彈保證相互毀滅 等於保證打有限度的戰爭
回列表(←)
分享