※ 本文為 terievv 轉寄自 ptt.cc 更新時間: 2017-08-16 22:47:59
看板 C_Chat
作者 標題 Fw: [新聞] 人工智能開始玩星海爭霸 2,它玩的如何?
時間 Mon Aug 14 11:49:20 2017
※ [本文轉錄自 StarCraft 看板 #1Pa7S_4S ]
看板 StarCraft
作者 標題 Re: [新聞] 人工智能開始玩星海爭霸 2,它玩的如何?
時間 Sun Aug 13 23:58:50 2017
論文:https://deepmind.com/documents/110/sc2le.pdf
如果AI以點擊為輸入介面的話,星海每個動作估計有10^8個可能性,相較之下,19路圍棋
每步棋最多只有19x19種可能性。
戰爭迷霧有特殊的圖形介面讓AI知道戰爭迷霧在哪裡(見論文圖2)。
APM設定成180,換算一下就是AI一秒最多只能下三道指令。
關於學習的部分,首先DM讓AI自己跟自己左右互搏,一場最多打30分鐘,超時算平手,學
到最後和內建最簡單的電腦1v1測試,AI一場也沒贏過,只有平手或輸掉兩種結果(見論文
圖5)。
到最後和內建最簡單的電腦1v1測試,AI一場也沒贏過,只有平手或輸掉兩種結果(見論文
圖5)。
之後DM讓AI去看800K個replay,這800K個replay從最低端到職業玩家都有,AI從這些
replay學習局面判斷能力。遊戲剛開始的時候,因為輸贏機率一樣,所以AI預測準確率為
50%。遊戲進行到愈後面AI準確率愈高,在遊戲時間15分鐘的時候AI有65%機率猜對最後結
果(見論文圖8)。
50%。遊戲進行到愈後面AI準確率愈高,在遊戲時間15分鐘的時候AI有65%機率猜對最後結
果(見論文圖8)。
然後DM讓AI模仿replay裡面玩家的行為,論文最後只提到AI會去生產一些軍事單位(見論
文圖9),沒提到能不能打贏最簡單的電腦......
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.177.51
※ 文章代碼(AID): #1Pa7S_4S (StarCraft)
※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1502639935.A.11C.html
推 : 很期待神功大成上場時 跟圍棋一樣吸引大家的關注 去瞭解RTS1F 08/14 00:05
推 : 所以這個AI連基本的兵種特性都不知道就下去打了? 這2F 08/14 00:20
→ : 不就等於教一歲的小朋友玩星海一樣
→ : 不就等於教一歲的小朋友玩星海一樣
推 : 重點就是這個從什麼不知道學會的學習過程4F 08/14 00:23
穆斯克版AlphaGo AI狂虐Dota2世界冠軍 - 國際 - 自由時報電子報
電玩遊戲Dota 2在12日一場國際邀請賽中,邀請曾獲得世界冠軍的職業玩家Dendi,與AI機器人OpenAI進行1對1表演賽,結果Dendi被OpenAI所擊敗。綜合媒體報導,雙方一開始約定進行3場比賽,第一場進行不到10分鐘Dendi就被OpenAI所擊敗,在第二場比賽進行途中Dendi直接放棄 ...
電玩遊戲Dota 2在12日一場國際邀請賽中,邀請曾獲得世界冠軍的職業玩家Dendi,與AI機器人OpenAI進行1對1表演賽,結果Dendi被OpenAI所擊敗。綜合媒體報導,雙方一開始約定進行3場比賽,第一場進行不到10分鐘Dendi就被OpenAI所擊敗,在第二場比賽進行途中Dendi直接放棄 ...
推 : 之前Deepmind它們訓練AI玩其他小遊戲的時候,都是沒跟6F 08/14 00:51
→ : AI說規則,只跟AI說要讓分數儘量高,接著就把遊戲放著
→ : 讓AI自己玩一整晚
→ : AI說規則,只跟AI說要讓分數儘量高,接著就把遊戲放著
→ : 讓AI自己玩一整晚
→ : 想 ai 贏還不容易.... bot 有的是啊9F 08/14 01:01
→ : 現在的BOT都是照腳本跑吧 離人工智慧還差的遠10F 08/14 01:07
→ : 看到APM設限與不限、先當掉、CC11F 08/14 02:51
推 : 所以啊. 重點是 AI 學習的過程12F 08/14 03:03
推 : 我也想和自己左右互博啊...但是一天頂多10場...13F 08/14 10:29
推 : 原PO借轉?14F 08/14 11:00
→ : 請自由轉貼15F 08/14 11:44
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: kira925 (115.176.80.121), 08/14/2017 11:49:20
→ : 感覺很有趣 可惜沒直播(?1F 08/14 11:52
→ : DeepMind網站上有些影片 然後就會發現AI根本不知道在幹嘛2F 08/14 12:13
推 : 住手啊,天網要出來啦3F 08/14 12:18
推 : 看twitch AI打bot還是笨笨的4F 08/14 12:19
推 : 想看twitch聊天室玩星海 VS 現在的AI 像twitch plays pok5F 08/14 12:51
→ : emon那樣
→ : emon那樣
推 : 讓AI跑教學任務有沒有用啊?7F 08/14 12:55
推 : 他們有用小型任務讓他學習過 像是 目標採到多少礦8F 08/14 12:59
→ : 或是產幾隻槍兵
→ : 或是產幾隻槍兵
→ : @Dsakura 控制不來10F 08/14 13:34
推 : 一開始ai下圍棋也是笨笨的啊11F 08/14 13:41
推 : 玩家學習兵種相剋很少是透過兩個兵種pk才學到的12F 08/14 17:50
→ : 要讓AI學會兵種相剋,應該是讓AI透過設定好的任務去訓練
→ : 學會兵種相剋之後,再安排學習資源分配(也就是流程)
→ : 之後的記錄檔訓練才會比較有意義
→ : 要讓AI學會兵種相剋,應該是讓AI透過設定好的任務去訓練
→ : 學會兵種相剋之後,再安排學習資源分配(也就是流程)
→ : 之後的記錄檔訓練才會比較有意義
--
※ 看板: terievv 文章推薦值: 0 目前人氣: 0 累積人氣: 160
作者 kira925 的最新發文:
- 15F 8推
- billions-of-cpus-knowing-of-downfall-vulnerability 事情的發生是2018年 當時 Intel 為了 Spectre/Meltdown 焦頭爛額 有其 …85F 37推 2噓
- 17F 4推 2噓
- 13F 3推
- 不是 你知道他前提是什麼吧XD 前面已經有板友討論了 中國直接把各個美日基地全部點名過去 所以飛機在地面躺 船艦也缺乏港口支援 這不覺得有套套邏輯嗎? 兵推前提美日在港口基地趴的差不多無法持續支援 = …104F 22推
點此顯示更多發文記錄
回列表(←)
分享