黄嘉满
- 作品数:3 被引量:12H指数:2
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于本体的商务领域文本检索的研究
- 2007年
- 文本挖掘技术是从海量文本信息中获取潜在有用知识的有效途径。传统的文本挖掘方法由于不能有效运用语义信息而难以达到更高的准确度。本体论为语义信息的合理表示和有效组织提供了理论支持和技术手段,把本体引入到商务企业文本检索中,以文本的段落为检索的最小单位,提出了一个信息检索的模型。该模型能从文本中抽取信息而建立本体标识符,用本体标识符来表示文本的段落,从而对检索要求和段落进行语义匹配,最后得到检索结果。
- 黄嘉满张冬茉
- 关键词:文本挖掘本体论信息检索
- 面向零售业的关联规则挖掘的研究与实现
- 虽然很多研究人员对关联规则的挖掘问题进行了大量的研究,然而对于零售业目前仍没有一个普遍认为最好的标准来判断规则的实用性;同时,零售商经常抱怨不知道怎样使用关联规则来优化其业务,这使得关联规则不能有效地在零售业的决策过程中...
- 黄嘉满
- 关键词:数据挖掘关联规则零售业数据库
- 文献传递
- 基于文本的关联规则提取方法的研究被引量:6
- 2008年
- 随着人们利用信息技术生产和搜集数据的能力的提高,数据资料的规模急速膨胀,从庞大的数据中提取有用的知识和信息是数据挖掘的主要任务,而关联规则的挖掘是数据挖掘领域中的一个重要分支。Fp-growth算法是目前最有效的关联规则频繁模式挖掘算法之一,然而,由于在挖掘的过程中需要递归的生成频繁模式树,直接把Fp-growth算法应用在文本中的算法效率并不高。针对文本数据的稀疏性,提出了一个基于频繁模式树即Fp-tree和支持度矩阵相结合的最大频繁项目集挖掘算法,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,算法对稀疏型数据集和稠密型数据均适用。
- 黄嘉满张冬茉
- 关键词:数据挖掘关联规则频繁模式增长最大频繁项目集