在圍棋這個(gè)人類一直以來占據(jù)著優(yōu)勢(shì)的項(xiàng)目里,谷歌旗下DeepMind開發(fā)的人工智能(AI)AlphaGo已經(jīng)先后擊敗了柯潔和李世石兩位頂尖棋手。但說來
在圍棋這個(gè)人類一直以來占據(jù)著優(yōu)勢(shì)的項(xiàng)目里,谷歌旗下DeepMind開發(fā)的人工智能(AI)AlphaGo已經(jīng)先后擊敗了柯潔和李世石兩位頂尖棋手。但說來難以置信,DeepMind開發(fā)的AI能打敗人類世界棋王,卻無法通過英國高中的數(shù)學(xué)考試。
《分析神經(jīng)模型的數(shù)學(xué)推理能力》
4月2日,谷歌旗下的DeepMind團(tuán)隊(duì)公布了一份名為《分析神經(jīng)模型的數(shù)學(xué)推理能力》的研究報(bào)告(Analysing Mathematical Reasoning Abilities of Neural Models)。在這項(xiàng)研究中,團(tuán)隊(duì)讓AI接受一項(xiàng)包含了算術(shù)、幾何、概率和測(cè)量的數(shù)學(xué)測(cè)試,考題有 40 題,難度大約是英國高中數(shù)學(xué)的程度。
DeepMind給出的40道英國高中數(shù)學(xué)題
不過,在這40道高中難度的數(shù)學(xué)題中,擁有強(qiáng)大通用算法和遠(yuǎn)超人類計(jì)算能力的人工智能,卻只答對(duì)了14題,正確率只有35%,是實(shí)打?qū)嵉牟患案瘛?/strong>
值得一提的是,在AI參加測(cè)試以前,團(tuán)隊(duì)已經(jīng)為其做好了充足訓(xùn)練。據(jù)DeepMind介紹,他們?yōu)锳I建立了一個(gè)包含200萬道題目的題庫,涵蓋了算術(shù)、代數(shù)、概率、微積分等各種題型。
同時(shí),團(tuán)隊(duì)也派出了循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 和Transformer兩大當(dāng)下性能最先進(jìn)的模型參與測(cè)試。
為什么人工智能無法答對(duì)高中數(shù)學(xué)題呢?
原來,最主要的原因是AI“看不懂”題目。DeepMind旗下的AI雖然已經(jīng)擁有了極強(qiáng)的機(jī)器翻譯能力,但依然抵不住數(shù)學(xué)問題的復(fù)雜性和語言多樣性的壓力。
對(duì)AI而言,數(shù)學(xué)符號(hào)和題目本身就很難理解
對(duì)人類而言,要解決數(shù)學(xué)問題,要應(yīng)用到的不只有計(jì)算能力,還有各種各樣的認(rèn)知技能。比如理解題干,需要將文字或圖標(biāo)轉(zhuǎn)換為算術(shù)運(yùn)算符。
而對(duì)于依賴大量數(shù)據(jù)分析來尋求解決問題規(guī)律的AI而言,數(shù)學(xué)語言的復(fù)雜性是一座難以逾越的高山。
其次,AI“舉一反三”的能力,也無法與人類一較高下。它只能處理一些內(nèi)部存儲(chǔ)的問題,無法超越已有的環(huán)境去理解新的東西。
而人類在解決數(shù)學(xué)問題時(shí),會(huì)進(jìn)行推理,從已知的公理中找到最佳策略,而在具體的運(yùn)算過程中,必須利用工作記憶來完成運(yùn)算。
據(jù)DeepMind研究人員總結(jié),現(xiàn)階段AI在推論的能力上,還不及人類。在解答問題時(shí),人腦動(dòng)用了多種認(rèn)知能力,包括將符號(hào)分類、演算、運(yùn)用工作記憶來儲(chǔ)存中間值、還要運(yùn)用學(xué)到的規(guī)則或定理等。
相反,AI則擅長模式比對(duì)、機(jī)器翻譯和強(qiáng)化式學(xué)習(xí),但彈性遠(yuǎn)不及人腦。它們不太能將事物推論到已有經(jīng)驗(yàn)的環(huán)境外,更無法處理刻意亂輸入的資訊。
不過,雖然目前AI還無法當(dāng)數(shù)學(xué)老師,但他們已經(jīng)稱霸了相當(dāng)多的領(lǐng)域。除了圍棋以外,DeepMind旗下的AI又在游戲《星際爭霸2》(StarCraft II)的測(cè)試賽中,5-0橫掃世界頂尖職業(yè)選手。(文/趙挪亞)
關(guān)鍵詞: 谷歌 AI 棋王 數(shù)學(xué)