您的位置: 专家智库 > >

薛丽华

作品数:3 被引量:5H指数:2
供职机构:长沙理工大学计算机与通信工程学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 2篇智能体
  • 2篇多智能
  • 2篇多智能体
  • 1篇映射
  • 1篇智能体系统
  • 1篇神经网
  • 1篇神经网络
  • 1篇自组织
  • 1篇自组织映射
  • 1篇组合神经网络
  • 1篇网络
  • 1篇多智能体系
  • 1篇多智能体系统
  • 1篇多智能体协作
  • 1篇BP网
  • 1篇BP网络
  • 1篇多AGENT...

机构

  • 3篇长沙理工大学

作者

  • 3篇薛丽华
  • 2篇殷苌茗
  • 2篇李立云
  • 1篇付超红
  • 1篇胡明辉

传媒

  • 1篇计算机工程与...
  • 1篇计算机工程与...

年份

  • 3篇2008
3 条 记 录,以下是 1-3
排序方式:
多智能体协作学习方法的研究
在多Agent系统中,由于环境是动态变化的,其他Agent的行为是未知的,所以多Agent系统及系统中的每个Agent应当具备学习或自适应能力。强化学习作为一种不需要环境模型的机器学习方法,现已成为多Agent系统的研究...
薛丽华
关键词:智能体多智能体系统多AGENT系统
文献传递
基于多智能体的融合Sarsa(λ)学习算法被引量:2
2008年
强化学习作为一种重要的机器学习方法,已经被广泛应用于许多单智能体和多智能体系统。强化学习的性能受所使用的学习算法及其参数的影响很大,不同的学习算法或者参数很小的变化都可能导致学习性能很大的变化。当环境模型未知时,确定最好的算法和最优的参数是困难的。为了避免参数的影响,提出了一种基于多Agent的融合Sarsa(λ)学习系统,它把强化学习环境当作多智能体环境来处理。最后用迷宫实验仿真,结果验证了该方法的可行性和有效性。
薛丽华殷苌茗李立云胡明辉
关键词:多智能体
基于组合神经网络的Sarsa(λ)学习算法
2008年
标准的Sarsa(λ)算法对状态空间的要求是离散的且空间较小,而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提出组合神经网络,首先用自组织映射(SOM)神经网络对状态空间进行自适应量化,然后在此基础上用BP网络拟合Q函数。该方法实现了Sarsa(λ)算法在连续和大规模状态空间的泛化。最后,实验结果表明了该方法的有效性。
殷苌茗付超红薛丽华李立云
关键词:组合神经网络自组织映射BP网络
共1页<1>
聚类工具0