美国伊利诺伊大学芝加哥分校刘德荣教授访问我校并做学术报告

科学研究

美国伊利诺伊大学芝加哥分校刘德荣教授访问我校并做学术报告

作者：冒泽慧审核人：访问量：1598发布时间：2019-12-24

2019年12月23日下午美国伊利诺伊大学芝加哥分校刘德荣教授，应南航国际交流合作处和自动化学院邀请进行了访问，在自动化学院1号楼403会议室并作了题为“Reinforcement Learning for Optimal Control”精彩的学术报告。学术报告由姜斌副校长主持，陈谋副院长、吴庆宪教授、刘春生教授、陆宁云教授等师生们参会，参会师生对刘德荣教授来访交流表示热烈欢迎。

报告开始刘教授提及，RL和ADP都起源于动态规划，在许多方面它们是等价的。自2006年引入迭代ADP方法以来，ADPRL在最优控制方面取得了重大突破。然而非线性系统的最优控制要求解非线性Bellman方程，而不是线性情况下的Riccati方程。离散时间Bellman方程比Riccati方程更难处理，因为它涉及到求解非线性偏差分方程。虽然动态规划是求解最优控制问题的一种有用的计算技术，但由于求解过程需要逆向的数值过程，即众所周知的“维数诅咒”。基于ADPRL的自学习最优控制为解决以下两个问题提供了有效的工具。(1)采用迭代ADP方法求解非线性Bellman方程，该方法具有收敛性。(2)利用神经网络进行函数逼近，得到正演数值过程。报告最后刘教授介绍了ADPRL最优控制的一些新进展。

学术报告后，参会的硕博士对于刘教授报告的内容进行提问，得到刘教授详细的解答，并与参会老师合影留念。

随后，刘德荣教授在南航自动化学院1号楼303报告厅举行“2020美国伊利诺伊大学芝加哥分校（UIC）本科交流及硕士学位（工程类专业）项目”宣讲会。

报告人简介：刘德荣教授是美国伊利诺伊大学芝加哥，电子与计算机工程和计算机科学的全职教授，入选中国科学院“百人计划”，2010年至2015年任自动化研究所复杂系统管控国家重点实验室副主任，《人工智能评论》(施普林格)的主编，2010年到2015年的IEEE神经网络和学习系统会刊的主编，IEEE会员，国际神经网络协会会员，国际模式识别协会会员。他在神经网络、最优控制、强化学习领域有着重要和持续的影响力。

科学研究

通知公告

科研动态

科研成果

科研基地

安全管理

大型仪器设备

保密管理

资产设备

制度规范流程

科学研究

美国伊利诺伊大学芝加哥分校刘德荣教授 访问我校并做学术报告

美国伊利诺伊大学芝加哥分校刘德荣教授访问我校并做学术报告