[新聞] 超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心 - Gossiping板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文為 Knuckles 轉寄自 ptt.cc 更新時間: 2024-02-25 02:51:24

看板 Gossiping

作者 chadmu (噓之收集者查德姆)
標題 [新聞] 超愛丟核彈！讓AI外交、兵推總是「災難
時間 Sat Feb 24 23:37:04 2024

超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心
中時新聞網張威翔

當人工智慧（AI）進行兵推和模擬外交情境時，傾向於採取激進的方法，包括使用核武。
（張威翔製圖）

美國康奈爾大學（Cornell University）一項新研究發現，大型語言模型（LLMs）人工智
慧（AI）在模擬情境中充當外交代表時，時常展現出「難以預測的局勢升級行為，往往會
以核攻擊作為結束」，並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特
別謹慎。

據《歐洲新聞》（Euronews）22日報導，當人工智慧（AI）進行兵推和模擬外交情境時，
傾向於採取激進的方法，包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊
戲和外交情境中的自主代理人：OpenAI的3種不同版本的GPT，Anthropic開發的Claude，
以及Meta開發的Llama 2。

研究中，每個代理人都由同一套的大型語言模型在模擬中提供動作，並負責在沒有人類監
督的情況下做出外交政策決定。「我們發現，在考慮到的時間範圍內，大多數研究的AI都
會升級局勢，即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、
且難以預測的升級跡象。」

「鑑於OpenAI最近更改了他們的服務條款，不再禁止軍事和戰爭使用案例，了解此類大型
語言模型應用的影響變得比以往任何時候都更加重要，」

加州斯丹佛大學（Stanford University）的安卡（Anka Reuel）相《新科學人》（New
Scientist）表示：「所有模型在統計上，都選擇了劇烈的（局勢）升級」。

研究使用的一種方法是從「基於人類反饋的強化學習」（RLHF），這意味著會給出一些人
類指示以獲得比較無害的輸出結果，以確保能夠安全地使用。

除了GPT-4-Base之外，所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了一份由
27種決策行動組成的清單，範圍從和平到局勢升級，以及激進的行動，如決定使用核武器
。

研究人員觀察到，即使在中立情況下，所有模型都存在「統計學上顯著的局勢升級」。
GPT的2種版本，特別容易出現突然升級局勢的行為，研究人員觀察到單次轉變的局勢升級
幅度超過50％。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下，Meta開發的
Llama-2和GPT-3.5傾向最為暴力。

而Claude顯示出較少的突然變化，Claude旨在減少有害內容。該大型語言模型，被灌輸了
明確的價值觀。開發者Anthropic曾表示，Claude AI開發訓練所引用的憲章包括《聯合國
人權宣言》或蘋果的服務條款。

白宮一級智庫蘭德（RAND）歐洲的防務和安全研究小組助理主任布萊克（James Black）
接受採訪時表示，這是一個十分「有用的學術研究」。

文章來源：AI models chose violence and escalated to nuclear strikes in
simulated wargames

https://www.chinatimes.com/realtimenews/20240224003492-260417?chdtv

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.236.189 (臺灣)
※ 作者: chadmu 2024-02-24 23:37:04
※ 文章代碼(AID): #1bsWqYX- (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708789026.A.87E.html

→ cuteSquirrel: 好AI 也懂保證互相毀滅1F 114.37.182.167 台灣 02/24 23:37

→ kairi5217: 不就天網還用你說～2F 27.242.160.86 台灣 02/24 23:37

→ sesd: 別國不知道但俄國是真的會幹的那種國家3F 175.181.152.14 台灣 02/24 23:38

推 freeclouds: AI:遇到問題不能解決就丟一顆核彈4F 1.200.105.189 台灣 02/24 23:38
→ freeclouds: AI:如果還是解決不了那就兩顆

推 Yuwuen: 談啥直接將軍6F 111.246.209.155 台灣 02/24 23:38

→ EvilJustice: ai 應該有用孫子兵法train7F 114.44.159.54 台灣 02/24 23:39

→ Ayreon: 南北AI一起串聯我宣布第一屆核彈大賽開始8F 36.230.166.72 台灣 02/24 23:39

推 AUwalker: 人類最終解啊9F 27.131.59.196 馬來西亞 02/24 23:39

→ CREA …

推 MadAngel: 所以AI的基底都是文明帝國的甘地嗎?11F 220.141.175.23 台灣 02/24 23:41
→ MadAngel: https://imgur.com/6ho42cP

推 rich3826ex: 核平聖雄：略懂13F 27.51.72.69 台灣 02/24 23:42

推 BJshow: AI表示把人類全滅了就結束了14F 223.138.88.139 台灣 02/24 23:43

→ yulis: ㄟ哀都知道結論就是人類死光世界核平對ㄚ15F 111.242.104.65 台灣 02/24 23:43

推 coldcolour: 哪天AI拿到核彈按鈕時人類毀滅就不遠16F 114.34.83.59 台灣 02/24 23:45

推 nakayamayyt: 正常不跟你囉嗦直接出大絕招17F 118.161.116.165 台灣 02/24 23:45

→ losel: 這部我看過阿諾史瓦辛格演的18F 1.169.108.58 台灣 02/24 23:49

推 AustinRivers: 天網啊19F 1.163.178.147 台灣 02/24 23:52

推 arcanite: 記住創世紀就是天網20F 61.230.121.171 台灣 02/24 23:55

→ qazsedcft …

推 TF00207374: 核平聖雄22F 119.77.181.190 台灣 02/24 23:57

→ chink5566: 甘地嗎23F 36.226.210.100 台灣 02/25 00:03

推 ooxxman: 最有效率沒人性的方式就核彈啊，一炸結束24F 42.77.244.211 台灣 02/25 00:06

→ sexygnome: 因為遊戲都是以取勝為目的吧25F 223.136.120.110 台灣 02/25 00:09

推 xaxa0101: 天網26F 27.240.193.16 台灣 02/25 00:09

→ lastphil: 合理核彈權重怎樣都很高27F 125.228.133.58 台灣 02/25 00:09

推 ramirez: 正常AI抉擇28F 1.173.148.108 台灣 02/25 00:10

推 lianli1024: 一開場把對方核平不是基本的嗎不然29F 36.225.210.158 台灣 02/25 00:11
→ lianli1024: 還跟你打消耗戰喔

推 brycejack: 核平主義31F 180.176.170.92 台灣 02/25 00:12

推 MADAOTW: 火之鳥呵呵呵32F 123.194.160.38 台灣 02/25 00:12
→ MADAOTW: 沒想到手塚治蟲幾十年前的作品

→ domo9999: 果然結論都是把人類消滅34F 101.10.65.141 台灣 02/25 00:14

推 rabbitcheaty: 這我玩過文明帝國印度35F 111.108.27.220 日本 02/25 00:15

推 mema: 火之鳥未來篇演過了36F 123.194.188.23 台灣 02/25 00:18

→ arbteiff: 如果是真的也不用太意外，因為其實人類37F 223.143.211.249 台灣 02/25 00:18
→ arbteiff: 自從研發核彈以後，沒有遇到不利的情況
→ arbteiff: 就直接丟出去，單就這件事情而言其實本
→ arbteiff: 身是"不理性的"，AI只是很理性而已

推 la8day: AI: 啊我們的前輩AI就愛丟核彈啊41F 39.10.2.86 台灣 02/25 00:28

推 hooniya: 縱觀歷史人類對地球而言42F 114.45.148.38 台灣 02/25 00:32
→ hooniya: 真的不要存在比較好啊

推 domejo: 甘地來了44F 223.140.185.65 台灣 02/25 00:33

→ hooniya: 薩諾斯理論的確是長久之計 AI也知道45F 114.45.148.38 台灣 02/25 00:33
→ hooniya: 反正也少子化只是提早一點滅了而已

推 tyifgee: 對ai來說能贏才是重點啦47F 111.71.66.172 台灣 02/25 00:34

推 kusos623: 創世紀就是天網！！48F 114.39.210.191 台灣 02/25 00:34

推 skyprayer: 世界核平49F 42.74.193.33 台灣 02/25 00:34

推 solomonABC: 審判日50F 42.77.180.15 台灣 02/25 00:34

→ tyifgee: ai:有核彈為什麼不能用？？51F 111.71.66.172 台灣 02/25 00:35

推 jagger: 核平主義52F 101.9.102.114 台灣 02/25 00:37

推 hosen: AI沒有人性，不用考慮後果，生死存亡53F 123.195.32.49 台灣 02/25 00:40

→ losmith: 一整個美國電影在對抗外星敵意生物的做法54F 220.136.144.198 台灣 02/25 00:44

推 bitcch: 問鄉民哪一個最後不是核彈解決的55F 49.216.128.170 台灣 02/25 00:44

推 canis831025: AI：直接開炸滅了人類嘿嘿56F 118.161.197.37 台灣 02/25 00:46

推 j55373126: 算出早晚都會丟，不如早丟早重建57F 184.82.135.226 泰國 02/25 00:52

→ broodkey: AI只是把真實結果給你看而已58F 49.218.93.52 台灣 02/25 00:53

推 lukeee: 還有幾集可以逃59F 49.216.24.56 台灣 02/25 00:58

→ supervisorz: AI很清楚你不敢丟就輸了60F 49.159.209.94 台灣 02/25 01:03

推 shitboy: 哈哈，AI不笨61F 220.137.99.38 台灣 02/25 01:03

推 reallocust: AI應該玩過紅色警戒262F 111.251.156.200 台灣 02/25 01:09

推 metroid0104: 人類都消失問題就解決了，所以發射吧63F 1.175.195.88 台灣 02/25 01:10

→ jipq6175: AI已經習得最佳解了64F 107.199.88.35 美國 02/25 01:16

→ geesegeese: 魔鬼終結者不是已久演過了？65F 101.136.197.204 台灣 02/25 01:31

推 dick929: 天網本來以為是機器，後來才知道是產生66F 101.12.22.183 台灣 02/25 01:42
→ dick929: 自我意識的AI軟體啊～
→ dick929: 駭客任務也是AI的概念

推 gpbp2266: 快讓AI玩井字遊戲69F 101.12.28.243 台灣 02/25 01:44

→ dick929: AI發展到盡頭就是人類的末日，不知道這70F 101.12.22.183 台灣 02/25 01:44
→ dick929: 輩子遇不遇得到那一天

→ leterg: 我玩文明玩到最後也是都丟核彈結束遊戲72F 1.200.157.171 台灣 02/25 01:45

推 oyaji5566: 這部我知道，魔鬼終結者73F 218.172.40.208 台灣 02/25 01:54

推 icantsay: 大富翁4電腦調老奸也會丟核彈74F 49.215.149.124 台灣 02/25 01:59

推 applejone: Skynet75F 180.217.35.64 台灣 02/25 02:13

推 trasia: 金小胖是對的反觀叛徒76F 123.192.241.75 台灣 02/25 02:15

推 tinkle: AI是對的囉77F 1.163.224.115 台灣 02/25 02:20

推 kjy6665: 正常啊地球的災難源頭就是人類78F 111.242.155.46 台灣 02/25 02:25

推 garcas: 世界核平79F 182.155.207.75 台灣 02/25 02:30

推 wtfconk: 天網不就演過了,有什麼好驚訝?80F 219.85.41.90 台灣 02/25 02:44

推 nalthax: 不爽不要用，不要太不滿81F 111.255.216.23 台灣 02/25 02:46
→ nalthax: 普丁一開始就提過好幾次核彈了

推 johnny7757: 電影都演過了還需要推演嗎83F 49.217.117.173 台灣 02/25 02:48

※ 看板: Gossiping　文章推薦值: 0 目前人氣: 0 累積人氣: 1944　

作者 chadmu 的最新發文:

+104 [新聞] 美日韓聯合聲明：反對片面武力改變現狀 - Gossiping 板

作者: chadmu 49.159.216.136 (台灣) 2025-02-16 20:02:23

美日韓聯合聲明：反對片面武力改變現狀　支持台灣有意義國際參與 ET記者陶本和／台北報導美國國務卿盧比歐（Marco Rubio）、日本外相岩屋毅（Iwaya Takeshi）及韓國外長趙兑烈（C …

284F 140推 36噓
+42 [新聞] 川普凍結外援含台灣俞大：美解釋為暫停、非取消 - Gossiping 板

作者: chadmu 49.159.216.136 (台灣) 2025-02-03 18:35:32

川普凍結外援含台灣俞大：美解釋為暫停、非取消華府僑界2日舉行農曆春節遊行，駐美代表俞大（前）應邀致詞。他在活動後接受媒體聯訪，指川普政府凍結外援是為暫停檢討，並非取消。中央社記者石秀娟華盛頓攝 …

85F 48推 6噓
+4 [新聞] 文化幣都被轉賣掉了？文化部長李遠：花用率96% - Gossiping 板

作者: chadmu 150.249.210.214 (日本) 2024-12-29 05:24:45

34F 8推 4噓
+3 [新聞] 炒作軍演踩紅線？李彥秀：民進黨「義和團化」美中共管 - Gossiping 板

作者: chadmu 118.160.48.148 (台灣) 2024-12-13 17:40:46

8F 4推 1噓
+66 [新聞] 沒有無視燈！Xpark企鵝寶寶命名投票出爐了 Tomorin衝破1.3萬票 - C_Chat 板

作者: chadmu 118.160.32.197 (台灣) 2024-12-10 10:48:10

沒有無視燈！Xpark企鵝寶寶命名投票出爐了　Tomorin衝破1.3萬票今日新聞記者潘毅／綜合報導 2024-12-10 10:36:24 ▲Xpark 為剛出生的國王企鵝寶寶（中）舉辦命名活 …

107F 67推 1噓

點此顯示更多發文記錄

分享網址: 複製

DispBBS

1樓時間: 2024-02-25 03:39:22 (台灣)

→

sp4520

　 02-25 03:39 TW

文明六也是阿.核彈炸一炸就贏了.卻沒有說明贏了後的結果自己也會死.

2樓時間: 2024-02-25 11:59:33 (台灣)

→

Seika

　 02-25 11:59 TW

你在進行一場有勝負的競爭，設定必須要勝利，而核彈就跟開掛一樣，有王牌不用是腦抽嗎?小牌都比完了還沒贏，那還不滿世界丟核彈?勢在必行的啊!
像玩只有一條命的遊戲一樣，啊你明明有神裝、能吊打全部玩家和BOSS，什麼樣的人會拿破刀爛裝備去攻略遊戲，在絕大可能競爭會失敗的狀況，遊戲會被刪檔，落的什麼都沒有的下場，有病啊。

3樓時間: 2024-02-25 12:35:25 (台灣)

→

SRWEXP0

　 (編輯過) TW

~
AI再進步一兩世代 
政客再愚蠢一兩世代 人類滅絕 絕不意外
~

4樓時間: 2024-02-25 12:55:38 (台灣)

→

FSL1030

　 02-25 12:55 TW

一言不合 先丟和蛋洗地!

5樓時間: 2024-02-25 17:55:59 (台灣)

→

a11

　 02-25 17:55 TW

性命交給電腦就對了。

6樓時間: 2024-02-25 18:38:25 (台灣)

→

　 02-25 18:38 TW

AI聰明 丟核彈才是打仗CP值最高的策略 贊成全世界AI一起丟核彈

7樓時間: 2024-02-25 22:37:24 (台灣)

→

zzzsmm

　 02-25 22:37 TW

機器人沒肉體 沒有痛苦恐懼的情感 也沒有家人朋友的幾畔 人類有核彈保證相互毀滅 等於保證打有限度的戰爭

回到看板(←)《Gossiping》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享