2015年,在民間被稱(chēng)為“中國(guó)版的AlphaGo”的“MyGo”軟件,在世界計(jì)算機(jī)圍棋錦標(biāo)賽上對(duì)抗國(guó)際同類(lèi)程序供圖/武坤
李世石又輸了,AlphaGo連勝三場(chǎng)。就在人們熱議人類(lèi)是否要在圍棋領(lǐng)域完敗的時(shí)候,一些棋友卻開(kāi)始想到武坤和他的“MyGo”,并將其稱(chēng)為“中國(guó)版的AlphaGo”。而武坤自己卻表示,他的“MyGo”即便能在國(guó)內(nèi)奪冠,但與AlphaGo對(duì)比,遠(yuǎn)遠(yuǎn)無(wú)法望其項(xiàng)背。
武坤是中南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院教授,他的“MyGo”也是一款圍棋人工智能。2015年11月,首屆美林谷杯世界計(jì)算機(jī)圍棋錦標(biāo)賽在北京工體附近進(jìn)行,在來(lái)自全世界的參賽隊(duì)中,“MyGo”只屬于第三梯隊(duì),相當(dāng)于圍棋業(yè)余二段的水平,而錦標(biāo)賽的冠軍也無(wú)非圍棋業(yè)余五段水平。那時(shí)誰(shuí)也沒(méi)想到,僅僅四個(gè)月后,他們?nèi)急籄lphaGo橫掃了。職業(yè)九段的李世石慘敗,而且還是三連敗。
制作三個(gè)月研發(fā)用了三年
在中南大學(xué),武坤對(duì)于圍棋的熱愛(ài),所有上過(guò)他課的學(xué)生都知道。武坤甚至專(zhuān)門(mén)開(kāi)了一門(mén)課程,就叫“圍棋人工智能”。
他的“MyGo”誕生于2011年,制作過(guò)程只用了三個(gè)月,但研究過(guò)程卻是三年。2008年,武坤認(rèn)識(shí)了職業(yè)八段圍棋選手王群,和王群的交流讓他發(fā)現(xiàn),職業(yè)圍棋選手的思維和一般人有明顯的區(qū)別,而這種區(qū)別可以用軟件的形式表現(xiàn)出來(lái),他說(shuō)這就是制作“MyGo”最早的念頭。
“二十歲不成為國(guó)手,則終身無(wú)望”,這是圍棋界的常識(shí),學(xué)圍棋必須從小開(kāi)始,但武坤直到上了大學(xué)才開(kāi)始接觸圍棋。制作“MyGo”之前,武坤沒(méi)做出過(guò)任何軟件,而“MyGo”的前三年“全都在做理論基礎(chǔ)”。武坤告訴北青報(bào)記者:“比如最簡(jiǎn)單的問(wèn)題,大家都知道執(zhí)黑先走,但是先走的是有優(yōu)勢(shì)的,因此圍棋規(guī)則都會(huì)給執(zhí)白棋的棋手一些優(yōu)惠,即‘貼目’,那么這個(gè)‘貼目’到底多少合適呢?圍棋發(fā)展幾千年了,一直都是憑感覺(jué)來(lái)定的。”武坤說(shuō),包括“貼目”在內(nèi)的諸多圍棋要素,都需要進(jìn)行數(shù)據(jù)化,這個(gè)過(guò)程最久也最艱難。
跨過(guò)“理論基礎(chǔ)”這個(gè)坎,武坤和他的團(tuán)隊(duì)就用了三年。
全國(guó)冠軍也只是世界第三流
2012年,武坤帶著“MyGo”的第一版參加了全國(guó)計(jì)算機(jī)博弈錦標(biāo)賽,這是中國(guó)一個(gè)專(zhuān)門(mén)供計(jì)算機(jī)圍棋人工智能比賽的平臺(tái)。據(jù)介紹,該比賽的主辦方包括中國(guó)人工智能學(xué)會(huì)和中國(guó)棋院,比賽項(xiàng)目除了圍棋,還有象棋、六子棋等,是各種“中國(guó)版AlphaGo”的競(jìng)技場(chǎng)。
第一次參賽,武坤的“MyGo”只拿到了全國(guó)第三,2013年第二次參賽還是第三名。武坤和學(xué)生們做了數(shù)十次改進(jìn)之后,2014年第三次參賽,“MyGo”終于獲得了全國(guó)冠軍,又在其后的2015年蟬聯(lián)冠軍,這時(shí)起,“MyGo”終于出名了。
雖然現(xiàn)在有人把“MyGo”捧為中國(guó)版的AlphaGo,但武坤自己認(rèn)為,橫掃了李世石的AlphaGo跟傳統(tǒng)意義上的圍棋人工智能根本就不是同一種東西。
2015年,新科中國(guó)冠軍的“MyGo”走上了國(guó)際賽場(chǎng),在首屆美林谷杯世界計(jì)算機(jī)圍棋錦標(biāo)賽上,“MyGo”八戰(zhàn)兩勝六負(fù),在9支參賽隊(duì)伍中僅排名第七。武坤表示:“前三名的人工智能算是第一梯隊(duì),第四到第六名算是第二梯隊(duì),而‘MyGo’只能算第三梯隊(duì),和前兩個(gè)梯隊(duì)之間的差距很明顯,很難下贏。”
但這還不是跟AlphaGo的差距。AlphaGo雖然沒(méi)有參加2015年世界計(jì)算機(jī)圍棋錦標(biāo)賽,但在這場(chǎng)賽事前一個(gè)月,AlphaGo已經(jīng)“小試牛刀”了。AlphaGo在2015年10月與歐洲圍棋冠軍職業(yè)二段選手樊麾進(jìn)行了五場(chǎng)對(duì)決,樊麾被無(wú)情碾壓,AlphaGo以5:0完勝。之后樊麾觀摩了2015年世界計(jì)算機(jī)圍棋錦標(biāo)賽,他提出參賽的圍棋人工智能水平和AlphaGo“根本無(wú)法相提并論”。
AlphaGo技術(shù)遠(yuǎn)超同類(lèi)程序
在AlphaGo手里三連敗,沮喪的并不只有李世石,還有武坤。“本以為我們的‘MyGo’和世界最強(qiáng)的人工智能只有業(yè)余二段到業(yè)余五段的差距,現(xiàn)在我們根本沒(méi)法估算跟AlphaGo的差距。”
武坤解釋說(shuō),相比其他圍棋人工智能,AlphaGo的程序算法非常先進(jìn)。“現(xiàn)如今,圍棋人工智能經(jīng)歷了三代算法,第一代是窮舉算法,即嘗試把所有可能的下法都算出來(lái),然后取必勝的一個(gè)。如果能夠窮舉,那么人類(lèi)注定無(wú)法戰(zhàn)勝人工智能,因?yàn)樗械淖兓荚谌斯ぶ悄艿恼莆罩辛恕_@對(duì)于國(guó)際象棋還有可能,但對(duì)于圍棋來(lái)說(shuō)就不現(xiàn)實(shí)。”武坤說(shuō),包括“MyGo”在內(nèi),2015年參賽的9支隊(duì)伍中8支都采用了第二代算法,這種算法利用高頻次的隨機(jī)抽樣、動(dòng)態(tài)評(píng)估、規(guī)劃路徑,選擇勝率最高的走法,也就是說(shuō)并不試圖窮盡所有的下法,而只是抽選一部分下法,然后選出勝率最高的那一種。這種算法大大提升了圍棋人工智能的水平,使得其可以和業(yè)余選手一較高低。但即使獲得了2015年全球錦標(biāo)賽冠軍的韓國(guó)人工智能“石子旋風(fēng)”,在和職業(yè)七段圍棋選手連笑的對(duì)決中,先后在“人類(lèi)讓四子”、“人類(lèi)讓五子”的比賽中落敗,直到連笑為“石子旋風(fēng)”“讓六子”,“石子旋風(fēng)”才獲得一次險(xiǎn)勝。
而AlphaGo的算法就遠(yuǎn)遠(yuǎn)超越了之前的算法,利用人工智能自我學(xué)習(xí)的能力獲得了飛躍。武坤說(shuō),其實(shí)類(lèi)似AlphaGo這樣的人工智能也曾經(jīng)在2015年的錦標(biāo)賽上出現(xiàn)過(guò),即法國(guó)的GoLois,這款法國(guó)圍棋人工智能可以模擬人腦神經(jīng)元,具有主動(dòng)識(shí)別、自適應(yīng)等功能,在圖像處理方面也異常強(qiáng)大。然而由于技術(shù)還不成熟,在所有9款圍棋人工智能中排名墊底。“當(dāng)時(shí)我們大家就感覺(jué)到了這種模擬人腦思維的算法的巨大潛力,但是沒(méi)想到,類(lèi)似的人工智能來(lái)得這么快,這么猛。”
盡管如此,武坤對(duì)于未來(lái)仍有信心。他打了個(gè)比方:就像電腦發(fā)明之后,很快誕生了各種更新型的電腦一樣。“之前大家都是在尋找方向,現(xiàn)在AlphaGo為我們開(kāi)辟了一個(gè)了不起的方向。隨著大家對(duì)新算法的深入研究,相信會(huì)有大批類(lèi)似AlphaGo的圍棋人工智能出現(xiàn),到那時(shí)中國(guó)也會(huì)有能做出超越世界超一流棋手的圍棋人工智能,那才是真正的‘中國(guó)版AlphaGo’。”文/本報(bào)記者屈暢