2019年12月23日下午美国伊利诺伊大学芝加哥分校刘德荣教授,应南航国际交流合作处和自动化学院邀请进行了访问,在自动化学院1号楼403会议室并作了题为“Reinforcement Learning for Optimal Control”精彩的学术报告。学术报告由姜斌副校长主持,陈谋副院长、吴庆宪教授、刘春生教授、陆宁云教授等师生们参会,参会师生对刘德荣教授来访交流表示热烈欢迎。
报告开始刘教授提及,RL和ADP都起源于动态规划,在许多方面它们是等价的。自2006年引入迭代ADP方法以来,ADPRL在最优控制方面取得了重大突破。然而非线性系统的最优控制要求解非线性Bellman方程,而不是线性情况下的Riccati方程。离散时间Bellman方程比Riccati方程更难处理,因为它涉及到求解非线性偏差分方程。虽然动态规划是求解最优控制问题的一种有用的计算技术,但由于求解过程需要逆向的数值过程,即众所周知的“维数诅咒”。基于ADPRL的自学习最优控制为解决以下两个问题提供了有效的工具。(1)采用迭代ADP方法求解非线性Bellman方程,该方法具有收敛性。(2)利用神经网络进行函数逼近,得到正演数值过程。报告最后刘教授介绍了ADPRL最优控制的一些新进展。
学术报告后,参会的硕博士对于刘教授报告的内容进行提问,得到刘教授详细的解答,并与参会老师合影留念。
随后,刘德荣教授在南航自动化学院1号楼303报告厅举行“2020美国伊利诺伊大学芝加哥分校(UIC)本科交流及硕士学位(工程类专业)项目”宣讲会。
报告人简介:刘德荣教授是美国伊利诺伊大学芝加哥,电子与计算机工程和计算机科学的全职教授,入选中国科学院“百人计划”,2010年至2015年任自动化研究所复杂系统管控国家重点实验室副主任,《人工智能评论》(施普林格)的主编,2010年到2015年的IEEE神经网络和学习系统会刊的主编,IEEE会员,国际神经网络协会会员,国际模式识别协会会员。他在神经网络、最优控制、强化学习领域有着重要和持续的影响力。