张雁冰
- 作品数:2 被引量:13H指数:1
- 供职机构:清华大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 再励学习在通信网络最优控制中的应用研究
- 随着互联网和移动通信的迅猛发展,大量涌现的实时多媒体应用对有线网络和无线网络的服务质量(Quality of Service)提出了更高的要求。为解决通信的稳定性,可靠性,可扩展性的问题,需要对通信网络进行多层面,多角度...
- 张雁冰
- 关键词:通信网络最优控制马尔可夫决策过程再励学习主动队列管理排队论
- 文献传递
- 基于再励学习的主动队列管理算法被引量:13
- 2004年
- 从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcementlearninggradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性.
- 张雁冰杭大明马正新曹志刚
- 关键词:拥塞控制主动队列管理再励学习