公共文化服务平台

2025年2月21日星期五

|

欢迎来到鞍山市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

薛丽华: 作品数：3 被引量：5H指数：2; 供职机构：长沙理工大学计算机与通信工程学院更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

李立云长沙理工大学计算机与通信工程学...
殷苌茗长沙理工大学计算机与通信工程学...
胡明辉长沙理工大学计算机与通信工程学...
付超红长沙理工大学计算机与通信工程学...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
1篇学位论文

领域

3篇自动化与计算...

主题

2篇智能体
2篇多智能
2篇多智能体
1篇映射
1篇智能体系统
1篇神经网
1篇神经网络
1篇自组织
1篇自组织映射
1篇组合神经网络
1篇网络
1篇多智能体系
1篇多智能体系统
1篇多智能体协作
1篇BP网
1篇BP网络
1篇多AGENT...

机构

3篇长沙理工大学

作者

3篇薛丽华
2篇殷苌茗
2篇李立云
1篇付超红
1篇胡明辉

传媒

1篇计算机工程与...
1篇计算机工程与...

年份

3篇2008

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

多智能体协作学习方法的研究: 在多Agent系统中，由于环境是动态变化的，其他Agent的行为是未知的，所以多Agent系统及系统中的每个Agent应当具备学习或自适应能力。强化学习作为一种不需要环境模型的机器学习方法，现已成为多Agent系统的研究...; 薛丽华; 关键词：智能体多智能体系统多AGENT系统; 文献传递

基于多智能体的融合Sarsa(λ)学习算法被引量：2: 2008年; 强化学习作为一种重要的机器学习方法,已经被广泛应用于许多单智能体和多智能体系统。强化学习的性能受所使用的学习算法及其参数的影响很大,不同的学习算法或者参数很小的变化都可能导致学习性能很大的变化。当环境模型未知时,确定最好的算法和最优的参数是困难的。为了避免参数的影响,提出了一种基于多Agent的融合Sarsa(λ)学习系统,它把强化学习环境当作多智能体环境来处理。最后用迷宫实验仿真,结果验证了该方法的可行性和有效性。; 薛丽华殷苌茗李立云胡明辉; 关键词：多智能体

基于组合神经网络的Sarsa(λ)学习算法: 2008年; 标准的Sarsa(λ)算法对状态空间的要求是离散的且空间较小,而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提出组合神经网络,首先用自组织映射(SOM)神经网络对状态空间进行自适应量化,然后在此基础上用BP网络拟合Q函数。该方法实现了Sarsa(λ)算法在连续和大规模状态空间的泛化。最后,实验结果表明了该方法的有效性。; 殷苌茗付超红薛丽华李立云; 关键词：组合神经网络自组织映射 BP网络

全选清除导出

共1页<1>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张