(Data-Driven Optimization Control with Off-policy Reinforcement
Learning)
报告人:罗彪副研究员(中科院自动化所)
报告时间:12月9日(星期五)10:00—11:00
报告地点:南教106
报告摘要:
对于许多实际工业过程,系统动态往往非常复杂,并存在各种不确定性及干扰,因而无法精确建立系统的数学模型。另一方面,随着信息技术与传感器技术的快速发展,工业数据的获取变得越来越简便。因而,如何有效的利用实际数据进行优化与控制设计,近年来得到了学者和工程师们广泛关注。为了解决复杂系统的数据驱动优化控制问题,罗彪博士提出了脱策强化学习方法并建立了相关收敛性理论,在系统模型未知的情况下,基于实际系统数据学习出优化控制策略,解决了无模型最优与H-inf控制问题。在这次报告中他将汇报近几年来所获得最新的研究成果。
个人简介:
罗彪,博士,中国科学院自动化研究所副研究员,2015年中国自动化学会优秀博士论文获得者。2013年,在香港城市大学担任研究助理;分别于2013年、2014年和2015年在德州农工卡塔尔分校担任研究助理。现担任国际重要SCI期刊《Artificial Intelligence Review》的编委,担任中国自动化学会自适应动态规划与强化学习专业委员会(CAA ADPRL-TC)秘书长。主要研究兴趣:自适应动态规划与强化学习、分布参数系统、数据驱动控制、机器学习与计算智能。
近几年一直从事自适应动态规划与强化学习方面的研究工作,相关研究成果发表在国际顶级学术期刊10余篇,包括Automatica、IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Cybernetics、Industrial & Engineering Chemistry Research等。
理学院科技处
016-12-07