胡明辉
- 作品数:4 被引量:3H指数:1
- 供职机构:长沙理工大学计算机与通信工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 关系强化学习的研究与应用
- 经过几十年发展,强化学习已得到长足的进步,已成为机器学习、人工智能研究中最活跃的领域之一。在实际问题中,由于状态空间的规模过大以及目前硬件条件的限制,导致算法的效率不高。现有的大多数算法都采用属性值计算,不能体现物体间的...
- 胡明辉
- 关键词:一阶谓词逻辑决策树
- 文献传递
- 基于图形硬件的双调排序算法优化
- 2008年
- 介绍一种新的并行排序算法,该算法以双调归并排序为基础,运用图形硬件的并行体系结构和二叉排序树数据结构的优点,用部分并行代替所有阶段的顺序执行,对双调排序算法进行优化。对该算法进行分析,在理论上n个序列在p个流处理器上的排序,最优的时间复杂度为O((nlogn)/p)。实验测试结果表明,优化后的算法比其它基于图形硬件的双调归并排序算法所用时间短。
- 宾洪斌何锫胡明辉
- 关键词:流计算图形处理器
- 基于ACCA的Option自动生成算法被引量:1
- 2008年
- 提出了一种新的分层强化学习(HRL)Option自动生成算法,以Agent在学习初始阶段探测到的状态空间为输入,并采用改进的蚁群聚类算法(ACCA)对其进行聚类,在聚类后的各状态子集上通过经验回放学习产生内部策略集,从而生成Option,仿真实验验证了该算法是有效的。
- 胡明辉殷苌茗李立云
- 关键词:分层强化学习OPTION蚁群聚类算法
- 基于多智能体的融合Sarsa(λ)学习算法被引量:2
- 2008年
- 强化学习作为一种重要的机器学习方法,已经被广泛应用于许多单智能体和多智能体系统。强化学习的性能受所使用的学习算法及其参数的影响很大,不同的学习算法或者参数很小的变化都可能导致学习性能很大的变化。当环境模型未知时,确定最好的算法和最优的参数是困难的。为了避免参数的影响,提出了一种基于多Agent的融合Sarsa(λ)学习系统,它把强化学习环境当作多智能体环境来处理。最后用迷宫实验仿真,结果验证了该方法的可行性和有效性。
- 薛丽华殷苌茗李立云胡明辉
- 关键词:多智能体