国家自然科学基金(60703014)
- 作品数:12 被引量:26H指数:3
- 相关作者:张伟哲张宏莉许笑吴太康方滨兴更多>>
- 相关机构:哈尔滨工业大学国家互联网应急中心中国科学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 一种基于位图的多模式匹配算法被引量:12
- 2010年
- 为降低自动机类多模匹配算法的空间开销,同时仍保持较低的算法时间复杂度,提出了一种基于位图的空间优化算法.将自动机全部状态按照字典树结构的层数划分,将访问频率较低的后若干层状态对应的转移表压缩存储,并使用位图提高对被压缩信息的检索速度.经过实验和在实际应用环境中的验证,这种改进算法能够大幅降低空间开销,而匹配时间或响应时间基本不变.在模式串的数量达到万条以上规模时,实验表明优化算法能够降低25%~70%的空间消耗.
- 张元竞张伟哲
- 关键词:有限状态自动机位图
- 面向垂直搜索引擎的Web站点划分方案被引量:4
- 2010年
- 分析传统搜索引擎分配任务的方式及存在的问题,根据垂直搜索引擎的特点,提出一种比传统方法粒度更细的任务分配方式——网站划分。该分配方式将较大规模的网站切分为若干较小规模的子集,并将子集交给若干爬虫节点并行抓取,以加快爬虫系统的整体获取速率,作为对传统方法的有效优化。将网站划分算法应用于样本数据集,验证其有效性。
- 李学凯许笑孙春奇张伟哲李斌
- 关键词:垂直搜索引擎爬虫
- 一个三层分布式计算网格任务调度系统被引量:3
- 2007年
- 将调度系统与网格中其他组件有效整合、建立网格环境下任务调度体系结构、构建真实网格环境下的资源管理与任务调度系统具有重要的现实意义。本文提出了一个三层分布式网格任务调度体系结构模型,侧重解决网格固有的异构、站点自治与策略可扩展性,网格域调度器是分布式调度系统核心组件,详细阐述了网格域调度器的功能模块设计与任务调度步骤;最后,通过一个应用级网格任务调度实例,给出网格任务调度过程及效果。
- 张伟哲何慧王秀华
- 关键词:分布式处理系统计算网格任务调度
- 增强Zhong-Yang协议中执行者输入的私密性
- 2009年
- 为了进一步提高Zhong-Yang协议在恶意环境中对移动代码执行者输入的私密性保护,使其能抵御恶意发起者进行的错误线密钥探测攻击,提出了一种可验证的倍增子电路,并用它来扩展Zhong-Yang协议中的加密电路.扩展的协议利用倍增子电路来代替执行者的输入线以抵御错误线秘钥探测攻击,并利用Jarecki和Shmatikov的带承诺加密电路构造技术和第三方质疑的零知识证明协议来保证子电路构造的正确性.分析表明:改进后的Zhong-Yang协议在多于2/3的服务器是诚实的情况下能同时抵御恶意服务器的篡改线密钥攻击和恶意发起者的错误线密钥探测攻击,仍然满足移动代码环境的非交互要求,且增加的通信和计算复杂度是多项式时间的.改进后协议能彻底保证恶意的移动代码环境中代码执行者输入的私密性.
- 叶建伟焦绪录张永铮
- 关键词:移动代码加密电路私密性承诺
- 基于簇结构的多中心网格资源监测系统
- 2009年
- 网格资源监测系统是网格系统的基础设施和必要组成部分,也是网格使用资源的前提保证。针对大规模网络信息探测的任务特点,结合各类网格通用需求,研究网格资源信息监测中关键技术,提出了基于簇结构的多中心网格资源监测系统体系结构和网格资源节点的动态加入与退出算法。通过实验分析和讨论了决定系统规模的主要因素并获得了簇的规模阈值。
- 张伟哲张宏莉张研顾学迈
- 关键词:网格计算资源监测簇结构
- 广域网分布式爬虫中的Agent协同与Web划分研究
- 2010年
- 针对广域网环境下分布式Web爬虫的Agent协同和Web划分两个核心问题进行深入研究,提出了基于顾问服务的分布式Web爬虫系统模型,给出了详细的系统设计方案及Agent协同算法框架,并通过推导证明了顾问服务参与Agent协同能够使分布式爬虫系统承受相对较小的网络负载。提出了分布式Web爬虫Web划分的概念,围绕Web划分单元选取及Web划分策略,对Web划分的分类和实现进行了详细的讨论,并通过实验对多种Web划分方法进行了对比和评价,验证了广域网系统相对于局域网系统的优势,并发现运营商互连因素对爬虫系统性能的影响大于地理位置因素的影响。
- 许笑张伟哲张宏莉方滨兴
- 关键词:AGENT协同
- 基于霍夫曼树的内容寻址网络失效区域恢复机制
- 2010年
- 针对内容寻址网络多区域失效导致的覆盖网结构破坏与子网割裂问题,提出了基于霍夫曼树的内容寻址网络失效恢复机制。采用霍夫曼树对覆盖网逻辑空间重新进行组织与优化,在失效结点检测机制的基础上,提出了单个区域与多个区域失效恢复机制。实验证明,该机制可以确保完整地恢复整个逻辑空间,解决内容寻址网络中结点和网络不稳定的问题,能很好地适用于动态自组织网络的管理,并可作为目前复杂多变的网络环境的管理模型。
- 张伟哲张宏莉吴太康许笑
- 关键词:对等网络内容寻址网络
- 内容寻址网络中路径缓存定向多播路由算法被引量:1
- 2010年
- 为解决内容寻址网络中资源定位速度和路由效率问题,提出了一种基于路径缓存技术的定向多播路由算法.该算法结合定向路由与广播路由的优势,引入扩展系数对定向多播路由算法进行空间维度扩展,降低了集体失效概率.将路径缓存技术与定向多播路由算法相结合,提高了系统的定位效率.通过与传统的定向路由策略进行实验比对,验证了该算法的有效性。
- 张伟哲张宏莉许笑吴太康
- 关键词:对等网络内容寻址网络路由算法
- 生物计算网格中的在线调度技术研究
- 2009年
- 研究了在异构网格环境下的生物应用集成,定义了服务的提供者、部署者和使用者三种用户角色,设计了网格环境下的服务和资源整合机制,重点实现了用户管理以及作业调度控制等功能。根据计算资源的异构特点,设计了多种启发式调度算法。考虑到生物计算应用的不同类型,提出了自适应调度算法,该算法根据应用的特点动态选择启发式调度算法。实验表明,非阻塞调度优于阻塞调度方式;自适应调度算法比静态的在线调度算法有更好的性能,而在异构的网络中,带宽优先调度算法的性能比其他静态调度算法性能更好。
- 刘文懋张伟哲张宏莉方滨兴
- 关键词:生物信息学计算网格在线调度
- 基于GNP算法的分布式爬虫调度策略被引量:6
- 2010年
- 针对分布式搜索引擎的任务调度及负载均衡问题,提出了基于GNP算法的分布式爬虫调度策略和负载均衡的方法。利用网络距离预估取代大规模的网络距离测量,不仅提高了系统的响应速度,还减少了系统对广域网造成的压力。通过在广域网上部署爬虫节点,构建分布式搜索引擎,应用该调度策略进行实验,验证了系统性能有较大提高。
- 刘爽姜春祥张伟哲李东张鸿
- 关键词:任务调度负载均衡网络测量