国家高技术研究发展计划(2011AA01A102)
- 作品数:100 被引量:239H指数:7
- 相关作者:王劲林孙鹏倪宏曾学文邓浩江更多>>
- 相关机构:中国科学院中国科学院大学北京邮电大学更多>>
- 发文基金:国家高技术研究发展计划中国科学院战略性先导科技专项国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术电子电信理学一般工业技术更多>>
- 嵌入式系统流水线资源管理模型被引量:1
- 2013年
- 针对嵌入式系统多任务多资源分配问题,提出了一种采用数据流水线的资源管理模型和基于模糊控制规则的自适应作业调度算法。该模型建立一组资源管理服务节点,每个服务节点管理一种类型资源,不同服务节点以流水线形式顺序处理任务作业。当多个不同任务的作业进入同一服务节点,该节点执行自适应作业调度算法进行多任务资源分配。该算法以保证不同任务作业实时性为目标,采用当前任务队列长度为输入,基于模糊控制规则自适应调整任务队列带宽。实验结果表明该模型使任务作业处理速度得到约1.4倍流水线加速提升,并能自适应分配资源,确保多任务作业实时性。
- 林军倪宏孙鹏张辉
- 关键词:流水线资源管理模糊控制嵌入式系统作业调度
- 多核网络处理器iSCSI发起端研究与实现被引量:1
- 2014年
- 针对已有的互联网小型计算机系统接口(iSCSI)发起端实现方式在面向多核网络处理器时存在的性能和扩展性不佳等问题,研究多核网络处理器的网络处理软件框架,提出基于多核网络处理器异构操作系统的网络处理软件框架。采用软件框架和P-SPL数据层面编程模型,给出一种iSCSI发起端实现方式。实验结果证明,相比基于Linux操作系统的iSCSI发起端实现,基于多核网络处理器异构操作系统的iSCSI发起端实现在吞吐率和响应时间上都有明显的性能提升。在6个千兆网口的测试环境中,读写吞吐率最高可达到180 MB/s,响应时间最多减少1.6 ms。
- 查奇文张武曾学文宋毅
- 关键词:多核网络处理器LINUX操作系统TCPIP协议栈
- 数据访问模型的现状被引量:1
- 2015年
- 数据访问模型是系统性能理解和优化的先决条件,针对不同类的应用,提取出其共用的访问特征,可以提高访问模型的适用性。数据访问模型的研究主要是探索数据访问的规律,根据研究对象的不同,现有模型主要分为两类:微观模型和宏观模型。本文认为在大规模数据下,研究数据访问之间的宏观规律——访问相关性为优化系统性能提供了新的机会。
- 刘建亮郭明阳许鲁
- 关键词:数据访问数据模型
- 一种基于短期预测的业务弹性伸缩算法被引量:4
- 2014年
- 针对地理分布云的业务部署问题,提出一种基于短期预测的业务弹性伸缩算法SPESS。该算法利用动态差分自回归移动平均模型对用户请求到达速度进行预测,综合考虑预测结果、业务的当前负载及处理速度,调整每个站点虚拟机的数量,从而在保障服务质量的同时尽可能地降低运行成本。实验结果表明,该算法能够在保障服务质量和运行成本之间取得较好的平衡,且业务整体负载、传输延时、排队时间均控制在一个合理的范围内。
- 郑鹏飞尤佳莉王劲林曾学文
- 关键词:云计算时间序列
- 两阶段密度意识子空间聚类模型
- 2014年
- 针对网格聚类方法在高维子空间聚类中网格规模随着维度急剧升高的问题,以及差别阈值方法引入干扰小聚簇的问题,提出一种具有两个网格划分阶段的密度意识子空间聚类模型。该模型第一阶段采用粗网格找出可能存在聚类的子空间区域,第二阶段在这些区域中进行等效精度更高的网格划分并找出所有致密单元。该模型在两个阶段处理的网格规模均远低于密度意识子空间聚类模型在相同划分精度下的网格规模,同时利用第一阶段对网格空间的筛选作用降低小聚簇干扰,提高聚类质量。合成数据集实验表明:该模型聚类精准率和查全率性能明显优于原模型;基于真实数据集实验,相比一次划分模型,该模型以损失0.4%数据点的代价提高输出聚类密度19.4%,聚类质量大幅提升。
- 李长路王劲林郭志川潘梁
- 关键词:数据挖掘子空间聚类网格聚类高维数据
- 一种多租户云的内部网络共享策略被引量:1
- 2014年
- 针对现有多租户云无法保障租户网络性能的问题,提出一种内部网络共享策略(FairNet)。该策略平衡了最小保证、公平分配、最大利用3个目标;为虚拟机增加了保证带宽和最大带宽2个定量描述网络性能的新参数,作为计算虚拟机和租户权重的基础;在虚拟机监视器中实现了限速器、队列和调度器;确保主机上每个虚拟机都能分配到一个最小带宽,且剩余带宽被虚拟机按需共享;综合考虑租户在链路发送端和接收端的带宽需求来计算租户权重,并按照权重的比例分配链路带宽。在NS-3仿真器上进行了实验,结果表明:FairNet在不同的通信模式下均能比其他算法更公平地分配链路带宽,有效消除了发送端和接收端不平衡的影响,能够确保虚拟机在主机上的最小带宽,以远比PS-N小的计算代价取得仅次于PS-N的网络公平性。
- 郑鹏飞尤佳莉王劲林曾学文
- 关键词:云计算内部网络网络共享带宽分配
- 多路径数据传输中的可用带宽测量算法研究被引量:4
- 2015年
- 在分布式中转服务器网络辅助的多路径数据传输系统中,为获得最快的数据传输速率,需要使用可用带宽测量技术以获得数据发送端至各中转服务器的可用带宽值列表。然而,传统的可用带宽测量算法难以同时兼顾测量精度与收敛速度,故无法达到实际数据传输系统中准确快速完成维护可用带宽值列表的目的。为解决上述问题,提出了一种可用带宽测量算法。通过收集初始探测流的包对在发送端及接收端的时间间隔关系数据获得可用带宽估测值,再以此值为后续探测流的发送速率初始值,通过自适应方法调整探测流发送速率以逐渐逼近可用带宽真实值。实验结果表明,改进算法能快速获得高精度的测量结果,有效提升可用带宽的测量效率,满足数据传输系统的需求。
- 吕阳王玲芳尤佳莉
- 关键词:网络测量可用带宽多路径传输
- 语言标注框架评述与对比分析
- 2019年
- 数据驱动是当前机器学习和人工智能技术的一大特征。高质量、大规模的标注数据集是领域技术发展的根基。在自然语言处理领域,标注数据的质量和数量直接决定了某个语言处理任务是否标准化,方法模型能否在公平条件下被评估和比较。而语言数据的人工标注是一个十分繁琐和复杂的过程,其中涉及诸如标注质量、标注管理、标注效率等诸多问题。为了解决这些问题,研究者提出了大量语言标注的工具和框架。本文介绍了语言标注的基本理论和技术,并对主流的两个语言标注框架GATE和UIMA进行评述和比较。
- 罗程多赵耀
- 关键词:文本标注
- 基于覆盖网络的多路径数据传输系统被引量:1
- 2014年
- 针对当前Internet转发数据包模式导致的较多不确定因素这一问题,实现了一种基于覆盖网络的多路径数据传输系统。通过在Internet的不同位置部署用于转发数据的中转服务器,形成分布式的中转服务器覆盖网络,使发送端能经由每一个独立的中转服务器并发地以多路径传输方式将待发送数据传送至接收端。实验结果表明,与当前的直接传输的模式相比,该系统能有效地提高文件传输效率。通过测量该系统的发送端与中转服务器之间的可用带宽值并应用于中转服务器的选择,还能进一步提高大文件的传输效率。
- 吕阳王玲芳尤佳莉
- 关键词:多路径数据传输覆盖网络端到端可用带宽
- 一种垂直页面分割与信息提取方法的研究被引量:3
- 2013年
- 在综合分析不同页面分割算法和适用条件的基础上,研究针对垂直型网站的页面分割和信息提取算法。以DOM(document object model)树为基础,提出页面内容聚集度的概念,统计获取页面分割标签和样式层叠表映射,对页面进行分割;采用正文识别和前缀匹配的方法,完成从页面分块信息提取。结合实际的网络视频项目需求,实现面向垂直型网站页面的分割和信息提取器。实验结果表明,该网页分割和信息提取方法对垂直页面信息提取具有良好的性能,满足实际项目需求。
- 李军李军陈君王玲芳
- 关键词:页面分割信息获取垂直网站前缀匹配