基于脱策强化学习的数据驱动优化控制方法

发布者:裴红艳发布时间:2016-12-08浏览次数:131

报告题目:基于脱策强化学习的数据驱动优化控制方法

Data-Driven Optimization Control with Off-policy Reinforcement

Learning

  

人:罗彪副研究员(中科院自动化所)

报告时间:129日(星期五)10:00—11:00

报告地点:南教106

报告摘要:

对于许多实际工业过程,系统动态往往非常复杂,并存在各种不确定性及干扰,因而无法精确建立系统的数学模型。另一方面,随着信息技术与传感器技术的快速发展,工业数据的获取变得越来越简便。因而,如何有效的利用实际数据进行优化与控制设计,近年来得到了学者和工程师们广泛关注。为了解决复杂系统的数据驱动优化控制问题,罗彪博士提出了脱策强化学习方法并建立了相关收敛性理论,在系统模型未知的情况下,基于实际系统数据学习出优化控制策略,解决了无模型最优与H-inf控制问题。在这次报告中他将汇报近几年来所获得最新的研究成果。

个人简介:

罗彪,博士,中国科学院自动化研究所副研究员,2015年中国自动化学会优秀博士论文获得者。2013年,在香港城市大学担任研究助理;分别于2013年、2014年和2015年在德州农工卡塔尔分校担任研究助理。现担任国际重要SCI期刊《Artificial Intelligence Review》的编委,担任中国自动化学会自适应动态规划与强化学习专业委员会(CAA ADPRL-TC)秘书长。主要研究兴趣:自适应动态规划与强化学习、分布参数系统、数据驱动控制、机器学习与计算智能。

近几年一直从事自适应动态规划与强化学习方面的研究工作,相关研究成果发表在国际顶级学术期刊10余篇,包括AutomaticaIEEE Transactions on Neural Networks and Learning SystemsIEEE Transactions on CyberneticsIndustrial & Engineering Chemistry Research等。

  

理学院科技处

016-12-07