基于脱策强化学习的数据驱动优化控制方法

发布者：裴红艳发布时间：2016-12-08浏览次数：131

（Data-Driven Optimization Control with Off-policy Reinforcement

Learning）

报告人：罗彪副研究员（中科院自动化所）

报告时间：12月9日（星期五）10:00—11:00

报告地点：南教106

报告摘要：

对于许多实际工业过程，系统动态往往非常复杂，并存在各种不确定性及干扰，因而无法精确建立系统的数学模型。另一方面，随着信息技术与传感器技术的快速发展，工业数据的获取变得越来越简便。因而，如何有效的利用实际数据进行优化与控制设计，近年来得到了学者和工程师们广泛关注。为了解决复杂系统的数据驱动优化控制问题，罗彪博士提出了脱策强化学习方法并建立了相关收敛性理论，在系统模型未知的情况下，基于实际系统数据学习出优化控制策略，解决了无模型最优与H-inf控制问题。在这次报告中他将汇报近几年来所获得最新的研究成果。

个人简介：

罗彪，博士，中国科学院自动化研究所副研究员，2015年中国自动化学会优秀博士论文获得者。2013年，在香港城市大学担任研究助理；分别于2013年、2014年和2015年在德州农工卡塔尔分校担任研究助理。现担任国际重要SCI期刊《Artificial Intelligence Review》的编委，担任中国自动化学会自适应动态规划与强化学习专业委员会（CAA ADPRL-TC）秘书长。主要研究兴趣：自适应动态规划与强化学习、分布参数系统、数据驱动控制、机器学习与计算智能。

近几年一直从事自适应动态规划与强化学习方面的研究工作，相关研究成果发表在国际顶级学术期刊10余篇，包括Automatica、IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Cybernetics、Industrial & Engineering Chemistry Research等。

理学院科技处

016-12-07