楊青林 |
|
報(bào)告題目: 單體智能到集群涌現(xiàn)的協(xié)同控制與決策研究
個(gè)人簡(jiǎn)介: 北京航空航天大學(xué)與軍事科學(xué)院培養(yǎng)博士生,研究方向?yàn)橹悄茱w行控制、強(qiáng)化學(xué)習(xí)、多智能體博弈技術(shù)。以第一作者發(fā)表論文4篇,其中SCI論文2篇。
摘要: 空天領(lǐng)域的發(fā)展趨勢(shì)正從以單個(gè)高性能平臺(tái)為核心的競(jìng)爭(zhēng),轉(zhuǎn)變?yōu)橐源笠?guī)模、智能化的無(wú)人系統(tǒng)集群為基礎(chǔ)的網(wǎng)絡(luò)化博弈。在此背景下,構(gòu)建底層飛行器控制到頂層集群智能協(xié)同決策體系,成為掌握未來(lái)空天主動(dòng)權(quán)的核心技術(shù)。在底層飛行器控制層面,傳統(tǒng)有模型的控制算法往往需要得到精確的系統(tǒng)模型,且復(fù)雜飛行器系統(tǒng)的計(jì)算量往往難以滿足實(shí)時(shí)要求。為此,本報(bào)告提出了基于神經(jīng)神經(jīng)網(wǎng)絡(luò)局部近似的模型預(yù)測(cè)控制方法。該方法采用神經(jīng)網(wǎng)絡(luò)擬合無(wú)人機(jī)的非線性動(dòng)力學(xué)模型,并在MPC預(yù)測(cè)時(shí)進(jìn)行局部近似,克服了傳統(tǒng)控制方法需要精確系統(tǒng)機(jī)理模型的限制,且有效降低了控制指令優(yōu)化的計(jì)算復(fù)雜度。在確保個(gè)體智能高效的基礎(chǔ)上,進(jìn)一步探索了群體智能協(xié)同決策機(jī)制。傳統(tǒng)多智能體強(qiáng)化學(xué)習(xí)方法常因獎(jiǎng)勵(lì)稀疏、信用分配等難題導(dǎo)致策略收斂到次優(yōu)解,難以形成高級(jí)協(xié)同。為此本報(bào)告構(gòu)建了基于認(rèn)知能力的Transformer-MAPPO架構(gòu),利用自注意力機(jī)制處理多架己方無(wú)人機(jī)的集體觀測(cè),從而實(shí)現(xiàn)對(duì)聯(lián)合團(tuán)隊(duì)狀態(tài)和智能體間依賴關(guān)系的豐富理解。為了解決智能體盲目低效探索,我們?cè)O(shè)計(jì)了基于認(rèn)知能力的自適應(yīng)熵以驅(qū)動(dòng)對(duì)不確定但信息豐富的區(qū)域進(jìn)行智能探索。結(jié)果表明,在勝率、生存率、復(fù)雜協(xié)同策略涌現(xiàn)方面,所提方法表現(xiàn)出卓越的性能,顯著優(yōu)于現(xiàn)有最先進(jìn)的基線。 |