国产成人亚洲欧美91_在线看片免费人成视频丨_久久免費视频精品_在线观看网站深夜免费A√

加快打造原始創(chuàng)新策源地,加快突破關(guān)鍵核心技術(shù),努力搶占科技制高點(diǎn),為把我國(guó)建設(shè)成為世界科技強(qiáng)國(guó)作出新的更大的貢獻(xiàn)。

——習(xí)近平總書(shū)記在致中國(guó)科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求

面向世界科技前沿、面向經(jīng)濟(jì)主戰(zhàn)場(chǎng)、面向國(guó)家重大需求、面向人民生命健康,率先實(shí)現(xiàn)科學(xué)技術(shù)跨越發(fā)展,率先建成國(guó)家創(chuàng)新人才高地,率先建成國(guó)家高水平科技智庫(kù),率先建設(shè)國(guó)際一流科研機(jī)構(gòu)。

——中國(guó)科學(xué)院辦院方針

首頁(yè) > 科研進(jìn)展

軟件所提出智能體遷移測(cè)試新方法

2024-10-08 軟件研究所
【字體:

語(yǔ)音播報(bào)

近日,由中國(guó)科學(xué)院軟件研究所天基綜合信息系統(tǒng)全國(guó)重點(diǎn)實(shí)驗(yàn)室與智能博弈重點(diǎn)實(shí)驗(yàn)室完成的研究成果Demo2Test:?Transfer?Testing?of?Agent?in?Competitive?Environment?with?Failure?DemonstrationsACM?Transactions?on?Software?Engineering?and?Methodology接收。該研究關(guān)注競(jìng)爭(zhēng)性博弈智能體的測(cè)試問(wèn)題,提出了對(duì)抗環(huán)境中智能體的遷移測(cè)試方法——Demo2Test。

在對(duì)抗環(huán)境中,雙方智能體通過(guò)激烈競(jìng)爭(zhēng)以爭(zhēng)奪博弈的勝利。智能體博弈策略失效可能帶來(lái)?yè)p失,因而對(duì)其進(jìn)行有效測(cè)試顯得尤為重要。當(dāng)前方法主要是通過(guò)構(gòu)建測(cè)試智能體,與目標(biāo)智能體展開(kāi)競(jìng)爭(zhēng),以誘發(fā)其故障。然而,此類(lèi)方法往往局限于單一任務(wù),進(jìn)行多任務(wù)測(cè)試則需耗費(fèi)更多時(shí)間,且難以保證測(cè)試的全面性和有效性。因此,亟需提出高效而通用的智能體測(cè)試方法。

該團(tuán)隊(duì)提出了新的遷移測(cè)試方法——Demo2Test。該方法利用源任務(wù)的演示數(shù)據(jù),結(jié)合強(qiáng)化學(xué)習(xí)和生成對(duì)抗模仿學(xué)習(xí),對(duì)測(cè)試智能體進(jìn)行遷移訓(xùn)練,以探索目標(biāo)任務(wù)中的失效場(chǎng)景。同時(shí),該方法包含一個(gè)關(guān)鍵狀態(tài)下的動(dòng)作擾動(dòng)模塊,應(yīng)用進(jìn)化算法對(duì)關(guān)鍵狀態(tài)下的行動(dòng)進(jìn)行擾動(dòng),可進(jìn)一步豐富失效場(chǎng)景的多樣性。

為驗(yàn)證Demo2Test框架的有效性,該團(tuán)隊(duì)在MuJoCo仿真機(jī)器人競(jìng)爭(zhēng)環(huán)境中進(jìn)行了嚴(yán)格實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,Demo2Test在發(fā)現(xiàn)失效場(chǎng)景的數(shù)量和多樣性方面均表現(xiàn)出色,相較于最佳基線(xiàn)分別提升了36.99%至87.98%和18.79%至60.98%。進(jìn)而,該團(tuán)隊(duì)利用Demo2Test發(fā)現(xiàn)的失效場(chǎng)景對(duì)目標(biāo)智能體進(jìn)行了重新訓(xùn)練。研究顯示,與基線(xiàn)方法相比,Demo2Test性能提升范圍為4.76%到80%。這驗(yàn)證了Demo2Test在智能體測(cè)試與優(yōu)化方面的有效性,為智能體測(cè)試領(lǐng)域帶來(lái)了新的思路與方法。

論文鏈接

Demo2Test框架圖

打印 責(zé)任編輯:侯茜

© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002

地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864

電話(huà): 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)

編輯部郵箱:casweb@cashq.ac.cn

  • © 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002

    地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864

    電話(huà): 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)

    編輯部郵箱:casweb@cashq.ac.cn

  • © 1996 - 中國(guó)科學(xué)院 版權(quán)所有
    京ICP備05002857號(hào)-1
    京公網(wǎng)安備110402500047號(hào)
    網(wǎng)站標(biāo)識(shí)碼bm48000002

    地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
    電話(huà):86 10 68597114(總機(jī))
       86 10 68597289(總值班室)
    編輯部郵箱:casweb@cashq.ac.cn