教育部“新世纪优秀人才支持计划”(NCET-10-0901)
- 作品数:2 被引量:28H指数:2
- 相关作者:徐昕王凯沈栋李兆斌黄振华更多>>
- 相关机构:国防科学技术大学亚利桑那大学中国科学院自动化研究所更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金霍英东青年教师基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LSPI和滚动窗口的移动机器人反应式导航方法被引量:7
- 2013年
- 结合最小二乘策略迭代(Least-squares policy iteration,LSPI)的算法特性和基于滚动窗口的实时重规划,提出一种新的基于LSPI和滚动窗口的反应式导航学习控制方法。仿真和实验结果表明:该方法对移动机器人在未知环境中的运动控制有效,并且对未知环境具有自适应性。
- 刘春明李兆斌黄振华左磊吴军徐昕
- 关键词:移动机器人
- 基于马氏决策过程模型的动态系统学习控制:研究前沿与展望被引量:21
- 2012年
- 基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。
- 徐昕沈栋高岩青王凯
- 关键词:MARKOV决策过程近似动态规划自适应控制