魏慶來 |
|
報告題目: 自學(xué)習(xí)最優(yōu)控制
個人簡介: 魏慶來,中國科學(xué)院自動化研究所研究員,博士生導(dǎo)師,中國自動化學(xué)會理事,國際神經(jīng)網(wǎng)絡(luò)學(xué)會理事。國家杰出青年基金獲得者。主要從事人工智能、自學(xué)習(xí)最優(yōu)控制,自適應(yīng)優(yōu)化決策、復(fù)雜系統(tǒng)自演化、自適應(yīng)動態(tài)規(guī)劃及其工業(yè)應(yīng)用等研究工作。目前發(fā)表/錄用論文200余篇,出版專著6部。作為項目負責(zé)人主持科研項目30余項,包括省部級以上基金項目9項。獲得IEEE Transactions on Neural Networks and Learning Systems Outstanding Paper Award,IEEE System, Man, and Cybernetics Society, Andrew P. Sage Best Transactions Paper Award,中國產(chǎn)學(xué)研合作創(chuàng)新獎,中國自動化學(xué)會青年科學(xué)家獎,中國自動化學(xué)會楊嘉墀科技獎,亞太神經(jīng)網(wǎng)絡(luò)學(xué)會青年學(xué)者獎,2015年張嗣瀛優(yōu)秀青年論文獎等10余項獎勵。入選全球高被引科學(xué)家。共擔(dān)任13本期刊編委包括6本IEEE期刊編委。擔(dān)任IEEE CIS Beijing Chapter, 副主席。
摘要: 報告主要介紹了基于自適應(yīng)動態(tài)規(guī)劃(Adaptive Dynamic Programming, ADP)的非線性系統(tǒng)自學(xué)習(xí)最優(yōu)控制方法的基本原理與研究進展。自適應(yīng)動態(tài)規(guī)劃由美國學(xué)者P. J. Werbos首次提出,以最優(yōu)性原理為基礎(chǔ),融合人工智能的先進方法,是解決大規(guī)模復(fù)雜非線性系統(tǒng)智能優(yōu)化控制問題的方法。自適應(yīng)動態(tài)規(guī)劃基于增強式學(xué)習(xí)原理,采用非線性函數(shù)擬合方法逼近動態(tài)規(guī)劃的性能指標,模擬人通過環(huán)境反饋進行學(xué)習(xí)的思路,有效地解決了動態(tài)規(guī)劃“維數(shù)災(zāi)”的難題,近年來被認為是一種非常接近人腦智能的學(xué)習(xí)控制方法。該項目首先介紹了自適應(yīng)動態(tài)規(guī)劃的基本原理,然后進一步介紹迭代自適應(yīng)動態(tài)規(guī)劃的基礎(chǔ)理論以及研究進展。 |