王芳
- 作品数:4 被引量:0H指数:0
- 供职机构:大连海洋大学更多>>
- 发文基金:辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术农业科学更多>>
- 基于图像特征深度强化学习的AUV管道循管方法
- 本发明公开一种基于图像特征深度强化学习的AUV管道循管方法。首先,将AUV循管控制问题建模为连续状态、连续动作的Markov决策过程;其次,控制策略抽象为AUV观测状态(摄像头获取的图像)到运动动作的映射,并利用深度神经...
- 林远山王芳于红常亚青崔新忠刘亚楠孙圣禹吕泽宇宋梓奇曹凯惠
- 文献传递
- 基于图像特征深度强化学习的AUV管道循管方法
- 本发明公开一种基于图像特征深度强化学习的AUV管道循管方法。首先,将AUV循管控制问题建模为连续状态、连续动作的Markov决策过程;其次,控制策略抽象为AUV观测状态(摄像头获取的图像)到运动动作的映射,并利用深度神经...
- 林远山王芳于红常亚青崔新忠刘亚楠孙圣禹吕泽宇宋梓奇曹凯惠
- 文献传递
- 基于深度强化学习的无地图移动机器人导航
- 2024年
- 针对传统导航方法对地图精度依赖和动态复杂场景适应差问题,提出一种基于课程学习的深度强化学习无地图自主导航算法.为了克服智能体稀疏奖励情况下学习困难的问题,借鉴课程学习思想,提出一种基于能力圈课程引导的深度强化学习训练方法.此外,为了更好地利用机器人当前的碰撞信息辅助机器人做动作决策,引入碰撞概率的概念,将机器人当前感知到的障碍物信息以一种高层语义的形式进行表示,并将其作为导航策略输入的一部分编码至机器人当前观测中,以简化观测到动作的映射,进一步降低学习的难度.实验结果表明,所提出的课程引导训练和碰撞概率可令导航策略收敛速度明显加快,习得的导航策略在空间更大的场景成功率到达90%以上,行驶耗时减少53.5%73.1%,可为非结构化未知环境下的无人化作业提供可靠导航.
- 户高铭蔡克卫王芳王芳张家旭金兆一林远山
- 关键词:移动机器人自主导航课程学习
- 基于深度强化学习的鱼类集群行为建模
- 2023年
- 【目的】使用深度强化学习技术对鱼类集群行为进行建模,探究鱼类集群行为的形成机理。【方法】针对传统基于规则的集群行为建模方法严重依赖人的先验知识而可能无法很好刻画集群行为的问题,提出一种基于Deep Q-Networks(DQN)的鱼类集群行为建模方法,以鱼类个体运动方向与周围邻居平均运动方向夹角表达个体的状态(连续值),以离散化的转角表示其动作,使用神经网络表达鱼类个体的运动策略。在单个学习者多个教师的环境中,以邻居数变化作为立即奖励,使用DQN算法训练神经网络,获得鱼类个体运动策略。【结果】使用本研究方法鱼类个体能学习到教师的运动策略,习得的鱼类个体运动策略在不同场景中均能涌现出集群行为,并且集群行为的特性与真实鱼群行为类似。【结论】本研究方法能够有效地对鱼类集群行为进行建模,有助于分析和理解复杂鱼类种群行为。分析得到的鱼类个体之间的局部交互机理,为理解鱼群形成、鱼类洄游、渔场形成等提供新视角,也可为工厂化高密度养殖提供参考。
- 陈鹏宇王芳王芳王芳宋亚男金兆一林远山
- 关键词:鱼群