吕庆 作品数:6 被引量:9 H指数:2 供职机构: 内蒙古科技大学信息工程学院 更多>> 发文基金: 国家自然科学基金 内蒙古自治区自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种非归并不确定XML小枝模式查询算法 被引量:2 2013年 针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。 刘立新 张晓琳 吕庆 张换香 褚艳华关键词:小枝模式 支持更新的连续不确定XML编码方案 被引量:3 2013年 提出基于p-文档模型的连续不确定XML的CUPE(continuous uncertain prime encoding)编码方案.该方案重复利用小素数编码,根据码值之间素数因子的包含关系能够快速精准地判定出XML树中任意两个节点的结构关系,并且可以支持文档更新.实验结果表明,相对区间编码和纯素数编码,CUPE是一种快速有效的编码方案. 张晓琳 吕庆 刘立新 郑春红关键词:素数编码 一种高效的连续不确定XML小枝模式匹配算法 被引量:4 2013年 针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用相互关联的链表存储中间结果,不需要归并。理论分析与实验结果表明,该算法是一种高效的连续不确定XML查询算法。 张晓琳 吕庆 刘立新 郑春红高效的连续不确定XML数据Top-k查询算法 2014年 目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又提出HPCProTJFast算法,该算法推迟了对连续节点的处理,只有在获得满足概率条件的整枝路径时才对连续节点进行访问。实验表明,在执行时间以及过滤效率上,同直接处理连续不确定数据的ProTJFast算法相比,这两种算法都要更高效,并且HPCProTJFast算法的效率更高。 张晓琳 郑春红 刘立新 吕庆关键词:XML TOP-K 连续不确定XML编码及查询技术研究 近年来,随着科学技术的进步,数据的处理和采集技术也得到突飞猛进的发展,人们对于不确定性数据的关注也越来越多,在不确定性数据中包含离散的不确定和连续的不确定两种类型的数据。在现实社会中,人们描述信息存在各异性、认知事物具有... 吕庆关键词:素数编码 查询技术 文献传递 连续不确定XML的Top-k查询算法研究 被引量:1 2013年 为了解决连续不确定XML高效的top-k查询,提出CProTJFast算法。该算法基于P-文档模型,扩展PEDewey(probabilistic extended Dewey)编码支持连续分布类型节点的编码,采用路径概率下限值进行节点过滤,并针对连续概率密度函数制定过滤策略,从而在计算连续节点概率之前过滤掉不参与结果的节点。实验结果表明,采用连续节点过滤策略的CProTJFast算法有效地提高了连续不确定XML的top-k查询效率。 张晓琳 郑春红 刘立新 吕庆关键词:TOP-K查询