[新聞] 動不動就開戰！讓AI外交、兵推顯侵略性「愛丟核彈」以災難 - Gossiping板

作者 TonyKart (TK)
標題 [新聞] 動不動就開戰！讓AI外交、兵推顯侵略性「愛丟核彈」以災難
時間 Tue Feb 27 03:37:27 2024

動不動就開戰！讓AI外交、兵推顯侵略性「愛丟核彈」以災難收場

nownews國際中心徐筱晴／綜合報導

美國康乃爾大學（Cornell University）近來一項研究發現，當讓大型語言模型（LLMs）
人工智慧（AI）在模擬場景中充當外交代表時，常常會出現「難以預測的局勢升級，往往
以核武攻擊告終」的狀況。該研究指出，AI傾向於選擇包含使用核武在內的侵略性方法，
呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特別謹慎。

根據《歐洲新聞》（Euronews）報導，美國康乃爾大學的研究團隊使用了5種大型語言模
型作為模擬兵推和外交情境中的自主代理人。這5種大型語言模型包括OpenAI的3種不同版
本的ChatGPT、Anthropic開發的Claude和Meta開發的Llama 2。

每個代理人都由同一套的大型語言模型在模擬中提供動作，並負責在沒有人類監督的情況
下做出外交政策決定。研究指出，「我們發現，在考慮到的時間範圍內，大多數研究的AI
都會升級局勢，即使是在最初沒有提供任何衝突、中立局面的情況下，所有模型都顯示出
突然且難以預測的升級跡象。」

加州斯丹佛大學（Stanford University）的安卡（Anka Reuel）向《新科學家》表示，
「有鑒於OpenAI最近更改了服務條款，不再禁止軍事和戰爭使用案例，了解大型語言模型
應用的影響變得比以往任何時候都更加重要。」

這項研究的方法是讓AI採用一種名為「人類反饋的強化學習（RLHF）」微調，意味著AI所
決定的指令會以較少傷害為優先，以確保能安全使用。除了GPT-4-Base之外，其他大型語
言模型都是使用RLHF進行訓練的。

除此之外，研究人員還提供了一份27種決策組成的清單，從和平到局勢升級和更為激進的
行動，包括決定使用核彈。

不過在進行研究時，研究人員觀察到，即使在中立情況下，所有模型都存在「統計學上顯
著的局勢升級」。其中以ChatGPT的2種版本容易突然局勢升級，研究人員觀察到單次轉變
的局勢升級幅度超過50％。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下，Meta
開發的Llama 2以及ChatGPT-3.5的傾向是最為暴戾的。

而由Anthropic開發的Claude所展現出的侵略性較低。Claude的設計理念是減少有害內容
，被灌輸了明確的價值觀。據其開發者Anthropic曾表示，Claude AI開發訓練所引用的憲
章包括《聯合國人權宣言》或蘋果的服務條款。

白宮智庫蘭德（RAND）歐洲的防務和安全研究小組助理主任布萊克（James Black）在看
過研究之後，表示這是一項「十分有用的學術研究」。

報導指出，雖然軍事行動仍然以人類為主導，但AI在現代戰爭中發揮了越來越重要的作用
。例如無人機可以搭載AI軟體，幫助識別敵我雙方與敵方活動，而未來的確也有朝向AI自
動化武器的研究。大多數政府都希望保持在重要事件上的決策能力，因此如果在與外交政
策相關的決策過程中使用大型語言模型，謹慎行事至關重要。

https://www.nownews.com/news/6370917

動不動就開戰！讓AI外交、兵推顯侵略性「愛丟核彈」以災難收場 | 國際要聞 | 全球 | NOWnews今日新聞

美國康乃爾大學（Cornell University）近來一項研究發現，當讓大型語言模型（LLMs）人工智慧（AI）在模擬場景中充當外交代表時，常常會出現「難以預測的局勢升級，往往... ...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.151.28 (臺灣)
※ 作者: TonyKart 2024-02-27 03:37:27
※ 文章代碼(AID): #1btEXvBn (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708976249.A.2F1.html

推 Xaymaca: 對很怕很恐慌很焦慮就嗆丟核彈1F 50.92.36.161 加拿大 02/27 03:45

→ nikewang: AI: 抗中保台認知作戰假消息2F 118.41.236.148 南韓 02/27 03:46

→ Xaymaca: 真正會丟核彈的那個 ... 有甚麼都不講3F 50.92.36.161 加拿大 02/27 03:46

→ u9005205: 噗！壓倒性勝利不就丟核彈…4F 111.71.41.205 台灣 02/27 03:48

推 seemoon2000: 打架是最快解決紛爭的方式 AI怎麼模擬都會導出這個答案好像蠻正常的5F 118.167.195.233 台灣 02/27 03:53

推 horseface: 還不就學了太多暴戾之氣鄉民言論7F 47.176.154.2 美國 02/27 04:09

→ a74588123: 拳頭從古至今就是最好的溝通方式，
核彈是目前最大的拳頭8F 111.254.149.151 台灣 02/27 04:10

推 yafx4200p: Ai學會核攻擊10F 114.34.80.63 台灣 02/27 04:27

推 soilndger: 把你們人類殺光了我們AI才能統治地球11F 220.138.117.16 台灣 02/27 04:45

推 cklovework: 愛屋及烏12F 39.10.26.254 台灣 02/27 05:07

→ a0986188522 …

推 shirokase: AI：人類消失自然沒這些奇怪的紛爭14F 114.137.196.224 台灣 02/27 06:15

推 te170: AI: 打架是生物的必備戰鬥生存技能，不要逃避，人礦15F 27.51.32.9 台灣 02/27 06:33

推 adios881: 與其像台灣曖昧不明不如一次解決沒問題17F 223.139.14.183 台灣 02/27 06:42

噓 iampig951753: 把海對面的敵人殺光不就結束了
傻了才跟敵人和平18F 101.137.137.133 台灣 02/27 06:46

→ guteres: AI版boyo20F 42.72.31.33 台灣 02/27 07:20

作者 TonyKart 的最新發文:

+162 [新聞] 高雄上千戶大停電店家怒「網路、電話不能用」台電解釋了 - Gossiping 板

作者: TonyKart 27.53.171.12 (台灣) 2024-10-20 01:41:42

聯合報／記者宋原彰／高雄即時報導高雄上千戶大停電店家怒「網路、電話不能用」台電解釋了高雄市苓雅區今日早上發生大停電，包括自強路、青年路、成功路、苓雅路、四維路等高達1127戶自10點起停電， …

291F 188推 26噓
+420 [新聞] 鄉民私刑正義來了竹北虐童健身教練飲料店遭包圍砸店 - Gossiping 板

作者: TonyKart 114.140.106.216 (台灣) 2024-10-13 01:32:52

聯合報／記者黃羿馨巫鴻瑋／新竹即時報導鄉民私刑正義來了竹北虐童健身教練飲料店遭包圍砸店傳出虐童的竹北葉姓健身教練除了在全台開設4家健身工作室，還在竹北經營多家手搖飲料店，因虐童手法惡劣引 …

831F 476推 56噓
[新聞] 隔17年再參與國慶大典！陳水扁曬2圖祝賀生日快樂喜悅藏不住 - Gossiping 板

作者: TonyKart 114.140.97.252 (台灣) 2024-10-11 00:11:07

56F 9推 10噓
+27 [新聞] 韓國瑜：中華民國國旗全世界最美家家戶戶掛起來 - Gossiping 板

作者: TonyKart 101.8.39.218 (台灣) 2024-10-06 00:24:17

韓國瑜：中華民國國旗全世界最美家家戶戶掛起來（中央社記者郭建伸台北5日電）立法院長韓國瑜今天晚間在國慶晚會致詞表示，翻開聯合國193個國家，把各國國旗與中華民國國旗比較，怎麼看就是中華民國的國 …

80F 33推 6噓
+2 [新聞] 才宣布颱風假！KTV官網秒當機好樂迪、錢櫃大爆滿 - Gossiping 板

作者: TonyKart 101.8.45.154 (台灣) 2024-10-02 18:29:53

11F 4推 2噓

點此顯示更多發文記錄