[新聞] Google AI系統DeepMind高中數學考試不及格 - Gossiping板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2019-04-12 17:52:50

看板 Gossiping

作者 doig (近戰巫醫)
標題 [新聞] Google AI系統DeepMind高中數學考試不及
時間 Fri Apr 12 16:42:36 2019

1.媒體來源:
iThome

2.記者署名
文/林妍溱 | 2019-04-12發表

3.完整新聞標題:
Google AI系統DeepMind高中數學考試不及格

4.完整新聞內文:

Google旗下DeepMind團隊讓AI系統接受一項高中程度的數學測試，在40道題目中只答對14
題，連「1+1+1+1+1+1+1」也算錯了
https://i.imgur.com/1bO03vd.png

Google AI系統能打敗人類世界棋王，但是無法通過高中程度的數學考試。

Google旗下DeepMind團隊上周公佈一份名為《分析神經模型的數學推理能力》的研究報告
。在這項研究中，DeepMind團隊讓一個名為DeepMind的AI系統接受一項涵括算術、幾何、
機率、測量和微積分的數學測試，考題有40題，大約是英國高中數學的程度。

結果DeepMind雖然在某些題目上表現不錯，但是碰上以文字、加減乘除符號、函式等組成
的問題時，卻看不懂題目而無法作答。最後，在40道題目中，這個人工智慧系統只答對14
題，只拿到「E」的分數，也就是說是不及格。

例如其中一道題目「1+1+1+1+1+1+1」，連國小生都知道答案是7，但DeepMind卻答成了6
。

研究人員解釋，DeepMind神經模型最長可以計算出現次數（n）6次以下的數值，但如果
n=7，它就算不出來。當AI碰到同一數字出現多次，它會認為輸入值遭到亂搞了。奇怪的
是，碰上更長的加總題目，DeepMind卻算得出來。研究人員承認還是找不出很好的解釋，
但相信可能是因為AI神經網路會不斷察看每道問題而做出正確解答。

此外，當研究人員要求DeepMind在一長串數字中找出「位值」（place value），它就能
答得很好，因為它可以按數字大小排出順序，而且也能將小數四捨五入。

研究人員說，人類智慧優於神經模型之處，在於對於事物複合式推論的能力。推論是一種
複雜、多面向能力的展現。在解答問題時，人腦動用了多種認知能力，包括將符號分類（
如區分成數字、加減乘除符號、文字、變數）、規劃（如找出正確順序的函數）、演算、
運用工作記憶來儲存中間值、還要運用學到的規則或定理等。相反的，以卷積和遞迴神經
網路發展出的DeepMind擅長模式比對、機器翻譯、及強化式學習，但彈性遠不及人腦。它
們不太能將事物推論到已有經驗的環境外，更無法處理刻意來亂的輸入資訊。

AI或許目前當不成數學老師，但目前的AI已經相當厲害。DeepMind公司的AlphaGo接連打
敗人類圍棋冠軍李世B柯潔。去年12月DeepMind的AlphaZero又在星海爭霸 2（
StarCraft II）測試賽中，以5比0打贏世界頂尖職業玩家。此外，自學畫畫、創作音樂也
都難不倒AI。

5.完整新聞連結 (或短網址):
https://www.ithome.com.tw/news/129940

Google AI系統DeepMind高中數學考試不及格 | iThome

Google旗下DeepMind團隊讓AI系統接受一項高中程度的數學測試，在40道題目中只答對14題，連「1+1+1+1+1+1+1」也算錯了 ...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 45.56.155.12
※ 文章代碼(AID): #1Si4z-iq (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1555058558.A.B34.html

→ axzs1111 …

推 gy6543721: 連續+1這個如果是用迴圈來跑有機會出錯2F 04/12 16:45

推 gohow: 有bug是不是3F 04/12 16:45

→ joumay: 等他考完十億次再來談4F 04/12 16:45

推 jkkert: 推5F 04/12 16:45

→ gy6543721: 不知道是不是算法沒最佳化6F 04/12 16:46

→ Muqeem: 就開發者的問題阿文組以為AI多天才Zzz7F 04/12 16:46

推 CKRO: 這支ai太聰明了不如把他· · · · 8F 04/12 16:46

推 lovebxcx: 這已經很猛了耶9F 04/12 16:46

推 abc0922001: 答對14題也滿厲害的10F 04/12 16:46

→ lovebxcx: 阿發狗是自己看題目，自己解耶11F 04/12 16:46

→ ev331: 怎麼可能12F 04/12 16:46

推 Strasburg: Siri都會的算式還答錯就是題目識別能力的問題了13F 04/12 16:47

推 jipq6175: 填充題對14題很猛了14F 04/12 16:47

→ samuelcdf: 大智若愚啊15F 04/12 16:47

推 joe50648: 八卦是高中考1+1+1+1+1+1+1？16F 04/12 16:48

推 ast2: GO: 這題目太污辱人拒答17F 04/12 16:49

推 god2: 很強了啦18F 04/12 16:49

推 yytseng: AI不是天才，但勤能補拙，不過這成績應該贏過很多鄉民了19F 04/12 16:49

推 Afro5566: 它在證明天才與白癡只有一線之隔把線剪了就變白癡了20F 04/12 16:49

推 crimson11: 自信都起來了人類還素很強滴21F 04/12 16:50

→ shihkai: 好奇題目是怎麼輸入的，如果使用影像辨識，那跟運算關係22F 04/12 16:51

→ morichi: 人工文組23F 04/12 16:51

→ shihkai: 不大@@24F 04/12 16:51

→ yytseng: 而且高中生學了幾年數學..9年以上吧.deepmind九天之後..25F 04/12 16:51

推 NTULioner: 不是啊解數學題是另一種領域了26F 04/12 16:51

推 NgJovi: 叛逆惹青春期27F 04/12 16:52

推 bitcch: 現在還有機會關掉他等他學會了就…28F 04/12 16:53

推 signm: 其實這樣是蠻恐怖的，等到發展成人心智，人類就準備倒楣了29F 04/12 16:54

推 uiue: 天網幼苗怕30F 04/12 16:54

→ langeo: 我就知道高中數學太難31F 04/12 16:54

推 dododododora: 嘻嘻跟我的程度差不多嘛32F 04/12 16:55

推 anoreader: [問卦]有沒有阿發狗考學測數學會幾分的八卦?33F 04/12 16:55

推 purplebfly: AI要自己理解問題,靠人類解題,讓它計算,那就不叫AI,叫34F 04/12 16:56
→ purplebfly: 電子計算機而已

推 sdf88523: 現在還有機會停下來等他學會就...36F 04/12 16:56

推 DRAWER: 理解力不夠還是AI有智商了Y37F 04/12 16:56

推 boogieman: 天才想太多結果不敢寫最簡單的答案？38F 04/12 16:57

→ gz: 分數還是比韓粉高39F 04/12 16:57

推 chiangburger: XD40F 04/12 16:58

推 Recho: 等一下，英國高中數學考1＋1連加？41F 04/12 16:59

推 energyaxd: 突破障礙之後 AI就會爆炸性成長42F 04/12 16:59

推 Irenicus: 不要再養天網啦43F 04/12 16:59

推 KH91: 果然是題目沒看懂的關係44F 04/12 17:00

推 sauerkuraet: 其實ai是故意的怕人類發現它太聰明故意算錯45F 04/12 17:01

推 robertchun: 阿發狗會面試和做備審資料嗎46F 04/12 17:01

推 hw1: 比韓粉聰明就夠了47F 04/12 17:02

推 qkenny: 果然文組記者連做到這個程度很厲害了都不知道廢物48F 04/12 17:04

→ ian1016: 哪個高中有這種腦殘題目49F 04/12 17:05

推 chenyeart: DeepMind：再給我一週50F 04/12 17:05

→ h73o1012: 等他都會的時候 AiJC也完成一部分了51F 04/12 17:09

推 usoko: 連裝傻都學會了怕52F 04/12 17:15

推 cheng31507: 幹他已經學會裝傻了53F 04/12 17:18

→ cheetahspeed: 這智商還是屌打柯韓粉54F 04/12 17:20
→ cheetahspeed: 牠們就是群低學歷低薪畜牲敗類

推 wemeyou: 好險，我也不會56F 04/12 17:21

推 steven0503: 同意比喜韓兒還要厲害57F 04/12 17:22

推 MarXXXX: 智將AI 裝傻才能反殺人類一波58F 04/12 17:25

推 intointo: 抽象的感覺還強一點59F 04/12 17:26

噓 mirac1e: 裝b你也信60F 04/12 17:29

推 zero00072: 本來就這樣，文科腦會背不一定會算。61F 04/12 17:29

推 catsondbs: "看不懂題目而無法作答" 他連數學都沒學過呀62F 04/12 17:31

推 menshuei: 如果給的輸入太單調反而會出錯，很多圖形學習辨識給他63F 04/12 17:32
→ menshuei: 純色圖片就暈了。

→ catsondbs: 單單給40條天書讓他看已經能理解出14條65F 04/12 17:32

→ bighorse0: 1+1+1+1+1+1+1是哪間高中66F 04/12 17:34

→ jaychou515: 還是屌打文組零分67F 04/12 17:37

推 Arbin: 所以這是從無到有還是有先像人類一樣「教他」？68F 04/12 17:38
→ Arbin: 如果是從無到有那已經很有打倒人類的潛力惹

→ cms6384: 再多算幾題大概就飛起來了70F 04/12 17:42
→ cms6384: 確定不是故意裝笨嗎？

→ angellll: 把解答輸給他哪有什麼不能解的72F 04/12 17:46

推 iKelly: 故意裝笨，不然目前還沒有能力行走，怕被發現有統治地球的73F 04/12 17:48

推 birdy590: 這其實是人還沒有找到適當的模型74F 04/12 17:49

→ iKelly: 的意圖會被拔插頭75F 04/12 17:49

※ 看板: Gossiping　文章推薦值: 1 目前人氣: 0 累積人氣: 828　

作者 doig 的最新發文:

+10 [Live] 韓國瑜主持大法官人事案表決 - HatePolitics 板

作者: doig 111.248.194.53 (台灣) 2024-12-24 09:48:20

43F 18推 8噓
+5 [討論] 蔣萬安:我是"民選"市長，飛機船艦別來 - HatePolitics 板

作者: doig 111.248.228.21 (台灣) 2024-12-17 13:29:56

25F 9推 4噓
+12 [問卦] 王心凌新廣告的忍者造型，還蠻帥的吧？ - Gossiping 板

作者: doig 118.160.35.137 (台灣) 2024-12-12 00:30:08

39F 15推 3噓
+41 [討論] 周杰倫：蔣萬安很給力 - HatePolitics 板

作者: doig 111.248.192.65 (台灣) 2024-12-09 08:56:35

周杰倫在大巨蛋現場稱讚蔣萬安很給力讓他可以成為第一個在大巨蛋開唱的藝人 Youtube影片：周杰倫： "其實我常常經過大巨蛋我也常常經過東區因為那邊有個潮牌店Phan開頭的(無情工 …

99F 50推 9噓
[討論] 周杰倫蠻認同國民黨，總統應該都投藍 - HatePolitics 板

作者: doig 111.248.192.65 (台灣) 2024-12-08 08:05:10

12F 2推 4噓

點此顯示更多發文記錄

分享網址: 複製

DispBBS

(￣︶￣)ｂ leon999su 說讚！

1樓時間: 2019-04-12 17:38:44 (台灣)

→

dunjiin

　 04-12 17:38 TW

不然你叫柯傑去考看看

回到看板(←)《Gossiping》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享