刘立新 作品数:37 被引量:70 H指数:4 供职机构: 内蒙古科技大学信息工程学院 更多>> 发文基金: 国家自然科学基金 内蒙古自治区自然科学基金 教育部“春晖计划” 更多>> 相关领域: 自动化与计算机技术 经济管理 更多>>
连续概率XML数据查询处理技术 被引量:2 2012年 目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p-文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p-文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及他们的参数;其次采用twig模式匹配找到符合用户要求的路径;然后根据要查询的连续分布类型确定概率查询应该使用符号表示法、积分法或直方图近似法:标准连续分布通过符号表示法中的参数或复杂的累积分布函数计算查询结果,满足积分条件的非标准连续分布采用积分法,其它情况采用直方图近似法。实验结果表明,该方法在概率查询的精确度以及响应时间上比现有方法更高效。 张晓琳 郑珍珍 刘立新 李玉峰关键词:查询处理 数据流频繁模式挖掘算法研究 数据流模型是近年来出现的、一种新型的数据模型,广泛应用于网络监测、传感器网络数据分析、Web点击数据流分析、金融行业和商业交易管理数据等中。数据流的连续、快速、无限、未知的特点决定了传统的数据挖掘技术已经不适合数据流挖掘... 刘立新关键词:数据流挖掘 最大频繁项集 剪枝策略 文献传递 一种非归并不确定XML小枝模式查询算法 被引量:2 2013年 针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。 刘立新 张晓琳 吕庆 张换香 褚艳华关键词:小枝模式 支持更新的连续不确定XML编码方案 被引量:3 2013年 提出基于p-文档模型的连续不确定XML的CUPE(continuous uncertain prime encoding)编码方案.该方案重复利用小素数编码,根据码值之间素数因子的包含关系能够快速精准地判定出XML树中任意两个节点的结构关系,并且可以支持文档更新.实验结果表明,相对区间编码和纯素数编码,CUPE是一种快速有效的编码方案. 张晓琳 吕庆 刘立新 郑春红关键词:素数编码 物联网环境下分布式的隐私保护数据聚合方案 2024年 为了解决在物联网场景下数据聚合中存在的中心化存储、隐私信息泄露、依赖可信第三方等问题,本文提出了工业物联网环境下分布式的隐私保护数据聚合方案(Distribued Privacy-Preserving Data Aggregation scheme,DPPDA).首先通过区块链技术与雾计算设计了一个分层分布式存储数据聚合架构,实现数据的去中心化存储;并且提出了基于阈值同态加密算法结合随机值噪声值对数据加密,实现用户数据隐私保护并且系统不依赖于完全可信的密钥管理中心;此外,结合Bloom过滤器与批量验证签名算法设计了一个高效的匿名签名验证机制,实现用户身份的隐私保护.安全分析和仿真测试验证本方案安全可行,有较好的抗攻击性和较低的计算成本.结果表明,本方案能够在物联网的数据聚合过程中保护用户数据隐私并具有较好性能. 施鑫垚 王静宇 刘立新关键词:区块链 数据聚合 隐私保护 基于数据流挖掘技术的入侵检测模型与算法 被引量:6 2011年 针对目前基于数据流关联规则挖掘技术的入侵检测系统响应速度不够快和检测精度不够高的问题,提出一个基于数据流最大频繁模式的入侵检测系统模型MMFIID-DS;设计各种剪枝策略,挖掘经过训练学习后的正常数据集、异常数据集和当前检测数据流的最大频繁项集,建立系统的正常行为模式、异常行为模式和用户行为模式,达到极大缩小搜索空间的目的,提高系统的响应速度;结合误用检测和异常检测2种入侵检测方法进行实时在线检测入侵,提高系统的检测精度。理论与实验结果表明:MMFIID-DS入侵检测系统具有较好的性能。 毛伊敏 杨路明 陈志刚 刘立新关键词:数据流 最大频繁项集 异常检测 误用检测 改进的数据流频繁闭项集挖掘算法 被引量:5 2011年 为提高数据流频繁闭项集的查找效率,提出一种改进的NewMoment频繁闭项集挖掘算法,通过在LevelCET数据结构中加入层次结点,并利用层次检测策略与最佳频繁闭项集检测策略快速挖掘数据流滑动窗口中所有的频繁闭项集。实验结果证明,与NewMoment算法相比,改进的算法性能更优。 刘洁 杨路明 毛伊敏 刘立新 谢东关键词:数据流 频繁闭项集 面向中文文本分类的对抗样本生成方法 2023年 针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确定修改策略生成对抗样本。使用两个主流的模型卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)在不同分类数据集上验证其有效性和可转移性。实验结果表明,与其他攻击方法相比,WordBeguiler具有攻击成功率高、扰动率低的优势,同时既保留了原始语义也一定程度上保证了语法正确性,并且可以有效地转移到BERT模型中。 弓燕 张晓琳 刘月峰 刘立新 徐立关键词:中文文本分类 汉字特征 黑盒 连续不确定XML数据查询处理算法 被引量:1 2013年 针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果,通过构造随机样本集线性拟合目标节点中的连续分布函数,避免了对大量矩形分段的处理,有效地减少了计算量。实验结果表明,在取得理想精度的同时,该算法具有高效性。 张晓琳 霍伟 刘立新 崔光月一种高效的连续不确定XML小枝模式匹配算法 被引量:4 2013年 针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用相互关联的链表存储中间结果,不需要归并。理论分析与实验结果表明,该算法是一种高效的连续不确定XML查询算法。 张晓琳 吕庆 刘立新 郑春红