——習(xí)近平總書記在致中國科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國科學(xué)院辦院方針
語音播報(bào)
10月19日,Nature官網(wǎng)刊發(fā)谷歌DeepMind關(guān)于阿爾法狗(AlphaGo)的最新論文,引起熱議。近幾年,以深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)為代表的人工智能(AI)理論和技術(shù),已經(jīng)在許多博弈對(duì)抗領(lǐng)域獲得成功。2016~2017年,谷歌公司的阿爾法狗擊敗世界圍棋頂級(jí)選手;2017年,加拿大阿爾伯特大學(xué)開發(fā)的DeepStack和美國卡內(nèi)基梅隆大學(xué)開發(fā)的人工智能系統(tǒng)Libratus在德州撲克中擊敗人類頂級(jí)玩家;2017年OpenAI公司的人工智能程序在《Dota2》游戲中擊敗人類頂級(jí)玩家。
這些人機(jī)對(duì)抗技術(shù)也在兵棋推演中獲得應(yīng)用。在中國科學(xué)院自動(dòng)化研究所的智能化大廈里,有一支由青年科研骨干組成的團(tuán)隊(duì)——智能人機(jī)對(duì)抗團(tuán)隊(duì),他們?cè)谥悄苋藱C(jī)對(duì)抗領(lǐng)域已經(jīng)多次小試牛刀,并取得了不錯(cuò)的成績。
兵棋推演系統(tǒng)獲勝
在9月27日舉行的2017全國首屆兵棋推演大賽上,自動(dòng)化所研制的人工智能程序“CASIA-先知V1.0”,在“賽諸葛”兵棋推演人機(jī)大戰(zhàn)中與全國決賽階段軍隊(duì)個(gè)人賽4強(qiáng)和地方個(gè)人賽4強(qiáng)的8名選手激烈交鋒,以7:1的戰(zhàn)績大勝。
自動(dòng)化所智能人機(jī)對(duì)抗成員范國梁研究員告訴《中國科學(xué)報(bào)》記者:“該程序展示了人工智能技術(shù)在博弈對(duì)抗領(lǐng)域的強(qiáng)大實(shí)力, 有望推動(dòng)我國博弈對(duì)抗技術(shù)的深入發(fā)展?!北逋蒲荩蛔u(yù)為導(dǎo)演戰(zhàn)爭的“魔術(shù)師”,主要采取以計(jì)算機(jī)為載體的電子兵棋系統(tǒng),推演者可運(yùn)用統(tǒng)計(jì)學(xué)、概率論、博弈論等科學(xué)方法,對(duì)戰(zhàn)爭全過程進(jìn)行仿真、模擬與推演,并按照兵棋規(guī)則研究和掌控戰(zhàn)爭局勢,增加軍隊(duì)在未來戰(zhàn)爭中獲勝的幾率。
此次“賽諸葛”兵棋推演人機(jī)大戰(zhàn)采用連級(jí)規(guī)模城鎮(zhèn)居民地遭遇戰(zhàn)的對(duì)抗想定,人工智能程序和人類選手在完全相同的場景和對(duì)等條件下進(jìn)行指揮對(duì)抗。
同樣來自自動(dòng)化所的智能人機(jī)對(duì)抗成員興軍亮研究員介紹道,相比人類選手,人工智能程序“CASIA-先知V1.0”能更加快速準(zhǔn)確地進(jìn)行態(tài)勢判斷和策略決策,很少犯低級(jí)錯(cuò)誤,進(jìn)而戰(zhàn)勝經(jīng)驗(yàn)豐富的人類高手。
據(jù)悉,“CASIA-先知V1.0”采用知識(shí)和數(shù)據(jù)混合驅(qū)動(dòng)的體系架構(gòu),構(gòu)建了人工智能指揮員模型。目前在態(tài)勢感知和作戰(zhàn)決策的主要模塊上采用知識(shí)規(guī)則+不確定推理的方式,第一步實(shí)現(xiàn)了知識(shí)驅(qū)動(dòng)的人機(jī)對(duì)抗和機(jī)機(jī)對(duì)抗系統(tǒng)。
星際爭霸:AI大賽歷練
10月初的一個(gè)周末,由美國人工智能協(xié)會(huì)(AAAI)所贊助的星際爭霸 AI大賽落下帷幕,自動(dòng)化所智能人機(jī)對(duì)抗的一支參賽團(tuán)隊(duì)獲得第四名。
星際爭霸AI大賽是加拿大紐芬蘭紀(jì)念大學(xué)David Churchill組織的年度活動(dòng),今年是第八屆比賽,比賽的目的是評(píng)估即時(shí)戰(zhàn)略游戲(RTS)對(duì)人工智能的意義。
自動(dòng)化所有3個(gè)AI Bot(軟件)參賽。其中,以獨(dú)立隊(duì)伍身份參賽的CPAC由張俊格、興軍亮等人完成,其研發(fā)的軟件采用了知識(shí)+數(shù)據(jù)驅(qū)動(dòng)的模式。另外兩個(gè)AI Bot由朱圓恒、唐振韜、邵坤、李楠楠和趙冬斌完成,代號(hào)分別為Juno和KillAll。其中,CPAC以71.01%的勝率排名第四。
興軍亮介紹道,《星際爭霸》作為一款經(jīng)典的即時(shí)戰(zhàn)略游戲,已成為深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、認(rèn)知決策等人工智能算法研究和測試的主要平臺(tái)和工具?!案鼮橹匾氖怯螒蜻€提供開發(fā)者接口,玩家可以編寫自己的程序操控游戲,不只是人在玩,還可以用程序去玩?!?/p>
此外,《星際爭霸》中包含的科學(xué)問題有多智能體協(xié)同、策略規(guī)劃與推理、不完全信息博弈等。相關(guān)核心技術(shù)可以廣泛應(yīng)用在金融學(xué)、經(jīng)濟(jì)學(xué)、生物學(xué)、社會(huì)學(xué)、計(jì)算機(jī)科學(xué)和軍事戰(zhàn)略等領(lǐng)域。
當(dāng)前,科技巨頭爭奪“XX智力游戲首勝人類冠軍”這一頭銜已經(jīng)越來越激烈化了,人工智能界的下一個(gè)目標(biāo)則是即時(shí)戰(zhàn)略游戲。今年8月,谷歌旗下人工智能公司(也是 阿爾法狗的創(chuàng)造者)DeepMind 就曾公開宣布,《星際爭霸2》將會(huì)是其下一個(gè)目標(biāo)。
范國梁指出,自動(dòng)化所之所以選擇《星際爭霸》來歷練團(tuán)隊(duì),主要是因?yàn)槠渥鳛榧磿r(shí)戰(zhàn)略游戲中的“即時(shí)”和“戰(zhàn)略”恰恰是人工智能在創(chuàng)新之路上需要挑戰(zhàn)的。
未來,自動(dòng)化所智能人機(jī)對(duì)抗團(tuán)隊(duì)將進(jìn)一步對(duì)相關(guān)核心技術(shù)進(jìn)行深入研究,打造決策與學(xué)習(xí)能力更強(qiáng)、更快的通用人工智能技術(shù)。
智能技術(shù)最終目的是為人服務(wù)
“無論是兵棋推演,還是星際爭霸,此前我們已經(jīng)在人工智能基礎(chǔ)理論和方法領(lǐng)域進(jìn)行了大量的研究,通過這些平臺(tái)很好地驗(yàn)證了團(tuán)隊(duì)的算法?!迸d軍亮說,“博弈對(duì)抗是人工智能發(fā)展的新方向,通過機(jī)機(jī)對(duì)抗系統(tǒng)可以實(shí)現(xiàn)對(duì)抗數(shù)據(jù)收集整理,為下一步知識(shí)和數(shù)據(jù)混合驅(qū)動(dòng)的博弈推理學(xué)習(xí)訓(xùn)練奠定了實(shí)驗(yàn)基礎(chǔ)。”
博弈對(duì)抗問題廣泛存在于軍事、商業(yè)、安防、災(zāi)害應(yīng)急等領(lǐng)域,大到影響國家戰(zhàn)略,小到?jīng)Q定有限資源下的個(gè)人競爭。博弈對(duì)抗技術(shù)已經(jīng)成為許多領(lǐng)域的標(biāo)準(zhǔn)分析工具之一,在證券學(xué)、生物學(xué)、國際關(guān)系、政治學(xué)和其他很多學(xué)科都有廣泛的應(yīng)用。
自動(dòng)化所智能人機(jī)對(duì)抗團(tuán)隊(duì)的成立也是瞄準(zhǔn)上述前沿應(yīng)用。自去年團(tuán)隊(duì)組建以來,現(xiàn)在團(tuán)隊(duì)規(guī)模已達(dá)40人,平均年齡約35歲,團(tuán)隊(duì)由楊一平副所長、劉成林副所長負(fù)責(zé),成員來自科研業(yè)務(wù)緊密關(guān)聯(lián)的不同實(shí)驗(yàn)室(研究中心),比如范國梁來自綜合信息系統(tǒng)研究中心,興軍亮來自模式識(shí)別國家重點(diǎn)實(shí)驗(yàn)室。
目前,智能人機(jī)對(duì)抗團(tuán)隊(duì)從基礎(chǔ)研究著手,聚焦不完全信息態(tài)勢感知和群體博弈策略優(yōu)化的關(guān)鍵技術(shù)問題,發(fā)展了基于不完全信息態(tài)勢估計(jì)的不確定決策推理技術(shù)。這種技術(shù)將大大提高博弈對(duì)抗的收益和效能,使我國在博弈對(duì)抗領(lǐng)域保持與世界先進(jìn)水平同步。
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào)
網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn