赵书良
- 作品数:96 被引量:454H指数:10
- 供职机构:河北师范大学更多>>
- 发文基金:国家社会科学基金国家自然科学基金河北省高等学校科学技术研究指导项目更多>>
- 相关领域:自动化与计算机技术经济管理文化科学社会学更多>>
- 基于断裂面特征的相似性度量网络和文物碎块拼接方法
- 本发明公开了一种基于断裂面特征的相似性度量网络和文物碎块拼接方法。度量网络包括第一至第二编码器子网络、重叠注意力子网络和第一至第二解码器子网络。文物碎块拼接方法包括成各文物碎块的密集点云、对各密集点云进行下采样和归一化处...
- 赵书良梁森卫王欣平
- 基于加权向量提升的多尺度聚类挖掘算法
- 多尺度聚类挖掘在指导人们进行多尺度决策方面有着不可取代的作用,然而传统的多尺度聚类挖掘算法有一个致命的弱点,即需要在每个用户感兴趣的尺度上应用聚类挖掘算法.为克服此缺陷,定义了一种将数据的多尺度特性进行向量化的方法;结合...
- 苏东海赵书良柳萌萌苏嘉庚李妍
- 关键词:数据库管理
- 文献传递
- 基于概念格的多值属性关联规则挖掘被引量:4
- 2014年
- 针对传统关联规则挖掘算法不利于用户选择关键数据进行分析、无法处理多值属性数据及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法来进行多值属性关联规则挖掘,运用概念格理论对多值属性数据进行了重新定义和分类;建立了数据挖掘参数调整机制,以提高算法挖掘效率,方便用户选择关键属性值进行规则挖掘分析。结合某省全员人口数据对算法进行了具体实现和分析。实验结果表明,算法性能具有较大提高。
- 郭晓波赵书良王长宾赵娇娇刘军丹
- 关键词:多值属性概念格关联规则APRIORI
- 多尺度数据挖掘方法被引量:28
- 2016年
- 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的.
- 柳萌萌赵书良韩玉辉苏东海李晓超陈敏
- 关键词:多尺度频繁项集关联规则
- 粒子群算法在分布式ETL任务调度中的应用被引量:3
- 2013年
- 随着分布式数据环境越来越复杂,ETL工具要面临数据源多、分布地域广和海量数据等因素带来的挑战。原有的集中式ETL工作流优化理论不能满足现在复杂数据环境的要求。介绍了如何将基于置换的离散型粒子群算法应用到分布式ETL任务优化调度问题上,主要工作围绕ETL工作调度模型、算法编码设计、目标函数选择等内容来展开,给出了分布式ETL工作调度策略的实现过程和伪代码。理论分析和实验证明了实际应用的有效可行性。
- 王春阳赵书良王长宾
- 关键词:任务调度
- 基于特征隶属度的文本分类相似性度量方法被引量:2
- 2017年
- 基于相似性进行文本分类是当前流行的文本处理方法。基于特征隶属度的文本分类相似性度量方法旨在利用特征与文档间的隶属关系度量文档相似性,从而实现文本分类。该方法基于特征与文档的隶属关系,对特征进行全隶属、偏隶属和无隶属词集划分,并基于3种隶属词集定义隶属度函数。全隶属词集隶属于两篇文档,隶属度随权差增大而降低;偏隶属词集仅隶属于其中某一篇文档,隶属度为一个定值;无隶属词集与两篇文档无隶属关系,隶属度为零。在度量相似性时,偏隶属关系高于全隶属关系。由于同类文档词集相近,异类文档词集差异明显,因此,基于特征与文档的隶属度进行相似性度量,可清晰界定词集与类别的隶属关系,提升分类精度。最后,采用数据集20-Newgroups和Reuters-21578对分类有效性进行验证,结果表明基于特征隶属度的相似性度量方法的性能优于目前流行的相似性度量方法。
- 池云仙赵书良罗燕赵骏鹏高琳李超
- 关键词:数据挖掘文本分类
- 数据挖掘在商务智能中的应用研究
- 赵书良赵明华孙慧刘东荣陈玉哲
- 该课题在深入分析商务智能系统各部分功能的基础上,研究比较了机器学习的各种分析方法及在商务智能领域中的应用效果;将模糊概念引入机器学习在商务智能系统的应用中,阐述了将模糊概念应用于商务智能中的优越性,模糊概念的引入能更好的...
- 关键词:
- 关键词:商务智能系统数据挖掘
- 基于VB的多媒体数据库图象管理系统的开发被引量:1
- 2004年
- 介绍了当前信息管理系统中多媒体数据库的特点,探讨了用VB实现多媒体数据库图象管理的方法与技术。多媒体数据库图象管理系统具有图象录入、删除、检索等多种功能。
- 王艳君赵书良刘海燕
- 关键词:多媒体数据库
- 一种新的面向普通用户的多值属性关联规则可视化挖掘方法被引量:8
- 2015年
- 针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规则可视化方法.运用概念格理论对多值属性数据进行了重新定义和分类,建立了较为完整的挖掘过程参数调整策略,方便用户选择关键属性值进行规则挖掘分析,提高了算法运行速度和挖掘效率.以概念格结构将多值数据组织起来,实现了对频繁项集的可视化展示,以及关联规则的多模式可视化展示.实验结果表明,改进后的挖掘算法具有更好的性能,所提出的可视化形式和已有成果相比具有良好的展现效果.
- 郭晓波赵书良王长宾陈敏
- 关键词:多值属性概念格关联规则
- 基于分形理论的多尺度分类尺度上推算法被引量:3
- 2018年
- 目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但还没有研究涉及一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(MultiScale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。
- 李佳星赵书良安磊安磊