国家自然科学基金(61201447)
- 作品数:47 被引量:132H指数:6
- 相关作者:朱颢东张素智朱付保黄敏徐家兴更多>>
- 相关机构:郑州轻工业学院重庆师范大学南阳理工学院更多>>
- 发文基金:国家自然科学基金河南省教育厅科学技术研究重点项目河南省高等学校青年骨干教师资助计划项目更多>>
- 相关领域:自动化与计算机技术文化科学电子电信轻工技术与工程更多>>
- 大数据下的Web数据集成与挖掘研究
- 2014年
- 随着Web 2.0技术的快速发展,社交网络、物联网、移动互联网等新兴服务行业日益涌现,Web数据呈爆炸式增长,成为炙手可热的"大数据"。Web大数据巨大的价值使得越来越多的人开始关注,如何获取Web数据并进行挖掘利用。在大数据的环境下,Web数据呈现出规模大、种类多、数据流高速性等特点,使得Web数据抽取与集成,数据分析,数据解释等方面的研究更加深入,与此同时,Web大数据的集成与挖掘仍存在着数据规模、数据多样性、数据时效性、隐私保护等方面的挑战。
- 张素智孙嘉彬王威
- 关键词:大数据
- 区域资源云平台构建教育均衡模式应用研究被引量:1
- 2014年
- 通过对区域化教育资源建设不均衡进行阐述,分析了区域化教育资源不均衡存在的问题;提出了实行政府主导、企业投资、用户租用服务的区域教育云计算服务平台模式。通过政府引导与监管,利用信息化教育手段为桥梁,建立基于云计算服务理念构建的资源共建、共享解决方案,实现区域教育资源均衡发展模式。
- 王华东杨杰
- 关键词:教育信息化教育均衡发展云计算
- 基于K-Means和Apriori算法的多层特征提取方法被引量:3
- 2015年
- 根据科技文献的结构特点,论文提出了一种四层挖掘模式,并结合K-means算法和Apriori算法,构建一个新的特征词提取方法——MultiLM-FE方法.该方法首先依据科技文献的结构将其分为4个层次,然后通过K-means聚类对前3层逐层实现特征词提取,最后再使用Aprori算法找出第4层的最大频繁项集,并作为第4层的特征词集合.该方法能够解决K-means算法不能自动确定最佳聚类初始点的问题,减少了聚类过程中信息损耗,这使得该方法能够在文献语料库中更加准确地找到特征词,较之以前的方法有很大提升,尤其是在科技文献方面更为适用.实验结果表明,该方法是可行有效的.
- 钱慎一朱艳玲朱颢东
- 关键词:特征提取K-MEANS算法APRIORI算法
- 面向聚类的堆叠降噪自动编码器的特征提取研究被引量:2
- 2016年
- 为解决短文本聚类时文本的高维稀疏性问题,提出一种基于堆叠降噪自动编码器的短文本特征提取算法。该算法利用深度学习网络形式,把多个降噪自动编码器网络逐层堆叠起来,将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间。实验结果表明,将提取的文本特征应用于短文本聚类,显著提高聚类的效果。
- 张素智魏萍萍徐家兴
- 关键词:特征提取聚类
- 基于电子商务的Web数据挖掘研究被引量:7
- 2015年
- 随着电子商务的高速发展,互联网、无线网络、移动网络的大面积覆盖,电子商务不仅潜移默化地影响着传统的商业模式,而且产生海量的Web数据,成为目前新的研究热点。电子商务"大数据"中隐藏的巨大的价值与Web数据挖掘技术在数据分析方面的作用使得二者自然的结合在一起。Web数据挖掘在电商巨量数据的分类、聚类、数据解释等方面发展迅速,与此同时,Web数据挖掘仍面临数据复杂性、计算复杂性、系统复杂性等方面的挑战。
- 张素智曲旭凯张琳
- 关键词:电子商务大数据WEB数据挖掘
- 基于改进Apriori算法的铁路轨道质量分析与评价被引量:5
- 2015年
- 设计了一种基于改进Apriori算法的铁路轨道质量分析与评价系统.首先对原始病害数据进行预处理,消除冗余数据,建立有效数据仓库;然后将数据进行分块处理,并对对应的决策表约简;最后利用改进Apriori算法减少扫描候选频繁项集的次数,寻找相应关联规则.通过对工务段线路病害进行评价,验证了该系统设计方案的合理性和有效性.
- 朱付保白庆春汤萌萌朱颢东
- 关键词:关联规则铁路病害数据挖掘
- 一种云网络学习空间的设计与实现被引量:2
- 2014年
- 针对目前E-learning平台应用受限的问题,设计并实现了基于云网络的学习空间.该学习空间基于MOOC功能和资源管理功能,以开源的Sakai平台为基础,使用Java EE企业级开发平台,结合Oracle数据库进行开发,实现了统一认证、平台应用/服务和数据存储3层架构对应的不同功能.试用结果表明:云网络学习空间性能稳定,加强了教学互动、协作学习和资源共建共享,弥补了传统教学平台的不足.
- 王华东李亚娟
- 关键词:社会化学习资源整合
- 采用经典一阶逻辑的混合系统仿真逻辑验证法
- 2015年
- 针对混合系统难以分析和验证的问题,提出了一种采用经典一阶逻辑的混合系统仿真逻辑验证法.首先给出了混合程序、混合系统仿真逻辑公式、仿真逻辑的命题形式和含义、混合仿真、混合程序仿真语义、仿真逻辑公式的值等定义,然后在经典一阶逻辑、混合程序仿真语义和仿真逻辑公式的值的基础上给出仿真逻辑形式推演规则.最后通过煮鸡蛋的例子验证了混合系统的活性.
- 卢中宁付金华张志锋
- 多源数据融合技术在后备干部管理系统中的应用被引量:3
- 2014年
- 随着社会信息化进程的逐步深入,各部门中已有业务系统在数据集成和信息共享方面存在不足,已达不到时信息资源整体开发利用的要求,这给后备干部信息管理工作带来了诸多不便。针对后备干部管理的业务特点和信息化的发展趋势,研发一个以数据集成和信息共享为目标的后备干部管理系统显得尤为重要。通过全面分析后备干部管理的业务需求和数据特点,提出了基于.NET平台和SQLite数据库的后备干部管理系统的设计方案,并以河南省为应用实例,验证了该系统设计方案的合理性和有效性。
- 朱付保徐显景霍晓齐朱颢东
- 关键词:数据集成数据融合信息孤岛信息共享数据仓库
- 基于四叉树的大规模地形的生成算法
- 2014年
- 提出了一种基于四叉树的多分辨率地形模型生成算法.该算法将视点相关、地势起伏等因素纳入细节层次的评价标准中,并在地形生成的过程中根据节点细分和渲染的规律,提出了合适的裂缝消除方法.地形绘制采用了视景裁剪、背面裁剪、三角扇形和静态数据预存等优化显示技术.实验结果表明,该算法能够快速实现大规模地形的实时可视化.
- 张娜殷知磊
- 关键词:三维地形四叉树视点相关多分辨率模型