郑春红 作品数:5 被引量:8 H指数:2 供职机构: 内蒙古科技大学信息工程学院 更多>> 发文基金: 内蒙古自治区自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种高效的连续不确定XML小枝模式匹配算法 被引量:4 2013年 针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用相互关联的链表存储中间结果,不需要归并。理论分析与实验结果表明,该算法是一种高效的连续不确定XML查询算法。 张晓琳 吕庆 刘立新 郑春红高效的连续不确定XML数据Top-k查询算法 2014年 目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又提出HPCProTJFast算法,该算法推迟了对连续节点的处理,只有在获得满足概率条件的整枝路径时才对连续节点进行访问。实验表明,在执行时间以及过滤效率上,同直接处理连续不确定数据的ProTJFast算法相比,这两种算法都要更高效,并且HPCProTJFast算法的效率更高。 张晓琳 郑春红 刘立新 吕庆关键词:XML TOP-K 支持更新的连续不确定XML编码方案 被引量:3 2013年 提出基于p-文档模型的连续不确定XML的CUPE(continuous uncertain prime encoding)编码方案.该方案重复利用小素数编码,根据码值之间素数因子的包含关系能够快速精准地判定出XML树中任意两个节点的结构关系,并且可以支持文档更新.实验结果表明,相对区间编码和纯素数编码,CUPE是一种快速有效的编码方案. 张晓琳 吕庆 刘立新 郑春红关键词:素数编码 连续不确定XML的Top-k查询算法研究 被引量:1 2013年 为了解决连续不确定XML高效的top-k查询,提出CProTJFast算法。该算法基于P-文档模型,扩展PEDewey(probabilistic extended Dewey)编码支持连续分布类型节点的编码,采用路径概率下限值进行节点过滤,并针对连续概率密度函数制定过滤策略,从而在计算连续节点概率之前过滤掉不参与结果的节点。实验结果表明,采用连续节点过滤策略的CProTJFast算法有效地提高了连续不确定XML的top-k查询效率。 张晓琳 郑春红 刘立新 吕庆关键词:TOP-K查询 连续不确定XML的Top-k查询算法研究 在很多实际应用中,数据的不确定性是普遍存在的,例如传感器网络、信息抽取与数据整合系统、科学数据管理系统等。传统的关系数据库采用结构化的存储方式,不适用于不确定数据的存储和管理。XML以良好的可扩展性和自描述性,成为更适于... 郑春红关键词:TOP-K查询 数据挖掘 文献传递