您的位置: 专家智库 > >

郑霞

作品数:1 被引量:1H指数:1
供职机构:闽江学院计算机科学系更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据挖掘
  • 1篇文本聚类
  • 1篇文档
  • 1篇聚类
  • 1篇基于XML
  • 1篇WEB内容
  • 1篇WEB挖掘
  • 1篇XML文档

机构

  • 1篇福建工程学院
  • 1篇闽江学院

作者

  • 1篇陈建国
  • 1篇郑霞

传媒

  • 1篇沈阳大学学报...

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于XML的Web内容挖掘方法被引量:1
2012年
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTML Tidy工具将非XML文件经过数据清洗后转换成结构良好的XML文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.
郑霞陈建国
关键词:WEB挖掘数据挖掘文本聚类
共1页<1>
聚类工具0