杜孝平 作品数:19 被引量:146 H指数:8 供职机构: 北京航空航天大学软件学院 更多>> 发文基金: 国家重点基础研究发展计划 教育部留学回国人员科研启动基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 医药卫生 建筑科学 经济管理 更多>>
FP-growth算法的实现方法研究 被引量:36 2004年 事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。 王新宇 杜孝平 谢昆青关键词:关联规则 数据挖掘 AFC系统异常连接测试工具的设计与实现 2015年 北京地铁车站设备和系统对异常数据的处理是否符合北京轨道交通AFC系统设计及实施规范要求,是地铁新线接入测试的必须环节。针对当前测试方法自动化程度不高,测试人员需要对AFC系统有详细了解才能很好地完成异常数据处理测试的问题,通过分析测试工作的内容,归纳测试数据与测试流程的种类,设计实现了具有自动生成测试数据、自动执行测试用例功能的异常连接测试工具;通过实际测试验证了设计工具功能的有效性。 杜孝平 张禄 李晔关键词:自动化 媒体微博商业价值评估模型的研究——基于凤凰网微博实例的模型研究 被引量:3 2014年 本文建立了一个适用于凤凰网微博的商业价值评估模型,该模型能够有效预测一条微博能够为客户带来多少广告传播价值,为招商资源报价和广告主的资源评估提供数据参考。同时,本文在建模过程中还对单条微博的商业价值进行了阐释,并给出了媒体微博商业价值评估的指标体系,对媒体微博的商业化具有实践意义。 章文佳 杜孝平预算约束和截止时间敏感的高能效云工作流调度 被引量:2 2022年 针对云工作流调度优化问题,提出一种基于预算约束和截止时间敏感的高能效工作流调度算法ESDWB。利用最长路径计算任务优先级,在满足剩余预算的前提下选择目标虚拟机;在不影响工作流执行跨度和预算约束的情况下,利用动态电压/频率调整方法DVFS扩展任务完成时间,进一步降低工作流的整体执行能耗。利用4种科学工作流结构进行仿真实验,其结果验证了ESDWB算法在满足预算约束的同时,还可以有效降低截止时间违例,减少工作流调度能耗,实现高能效任务调度。 张雪峰 杜孝平 王晓健 王哲关键词:云计算 工作流调度 预算约束 能效 网吧上网人员伴随分析与算法改进研究 2014年 为了准确快速析出关于网吧上网人员记录的频繁项集,通过研究该类海量数据的特征以及各类频繁项集算法,发现在频繁项集析出后的数据量是相对大大减少,可以用Apriori进行关联规则的挖掘,但是海量上网人员记录信息中伴随组之间没有伴随情况,而Apriori算法的频繁项集的析出过程针对该类数据在频繁2-项集的候选过程中会进行初始伴随组之间的大量无用的组合与搜索,同时数据中有部分超长伴随集需要进行有效分割。本文采用了基于初始伴随组内部产生频繁2-候选集和用已有的频繁2-项集分割超长初始伴随组。针对此类数据,最后改进的算法应用结果比直接运用算法提高效率20倍。 陈方云 杜孝平关键词:频繁项集 浅析利用搜索引擎优化技术提升企业排名 2015年 企业搜索引擎优化是相对于传统企业营销而言的,是一种互联网时代下使企业在自身网站优化及投放平台的选择与优化中提升企业排名的方法。本文解释了搜索引擎优化的内涵特点,利用网络数据分析了影响企业排名的优化因素,探讨了提高企业排名的有效途径。 兰双俊 杜孝平关键词:搜索引擎优化 频繁项集挖掘中的两种哈希树构建方法 被引量:9 2002年 Hash-tree is an important data structure used in Apriori-like algorithms for mining frequent itemsets.However, there is no study so far to guarantee the hash-tree could be built successfully every time. In this paper, wepropose a static method and a dynamic one to build the hash-tree. In the two methods, it is easy to decide the size ofhash-table, hash function and the number of itemsets stored in each leaf-node of hash-tree, and the methods ensurethat the hash-tree is built successfully in any cases. 杜孝平 罗宪 唐世渭关键词:数据库 数据挖掘 频繁项集挖掘 快速关联规则挖掘算法 被引量:36 2002年 关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度。该文在仔细分析这些算法所存在的效率瓶颈的基础上,提出了另一个有效的改进算法。所提算法通过利用一个一维数组替代已有算法中的复杂的哈希树来达到改善它们效率瓶颈的目的。通过多个实验评估,该文所提算法的挖掘效率很高,比Apriori及其改良算法要快2到5倍。 杜孝平 马秀莉 唐世渭 牧之内 显文关键词:频繁项集 关联规则 数据挖掘 数据库 知识发现 一种app软件工程师软技能分类系统及方法 本发明涉及一种app软件工程师软技能分类系统及方法,用于分类从app软件开发工程师招聘广告中提取出的软技能。本发明从软件工程师技能招聘要求中提取软技能,首先对招聘广告信息进行数据收集和清理,然后对其中信息进行预处理提取短... 贾经冬 刘熙 陈祖鹏 杜孝平基于PID的移动机器人运动控制系统设计与实现 被引量:9 2016年 介绍了一种自主移动机器人的运动控制系统,通过自主移动机器人的运动学建模,提出了一种有效控制机器人沿期望速度和方向运动的PID闭环控制方法,以此开发了以STC12C5A60S2微处理器、MC33886电机驱动芯片与霍尔传感器为主要构件的硬件系统,以及模块化的软件程序,实验证实该控制方法有效且稳定。 杜孝平 赵凯琪关键词:自主移动机器人 PID 运动控制