您的位置: 专家智库 > >

张东礼

作品数:2 被引量:58H指数:1
供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...

主题

  • 2篇中文
  • 2篇向量
  • 2篇向量空间
  • 2篇向量空间模型
  • 2篇VSM
  • 1篇信息处理
  • 1篇特征提取
  • 1篇中文网页
  • 1篇中文网页分类
  • 1篇中文文本
  • 1篇中文文本分类
  • 1篇中文文本分类...
  • 1篇网页
  • 1篇网页分类
  • 1篇文本分类
  • 1篇文本分类系统
  • 1篇文字信息
  • 1篇文字信息处理

机构

  • 2篇清华大学

作者

  • 2篇郑纬民
  • 2篇张东礼
  • 2篇汪东升

传媒

  • 1篇清华大学学报...
  • 1篇2002年全...

年份

  • 1篇2003
  • 1篇2002
2 条 记 录,以下是 1-2
排序方式:
一个基于VSM的中文网页分类器的设计与实现
随着网络技术的迅猛发展,中文网页分类作为信息处理的一个重要研究方向已经变得越来越重要.本文主要对网页分类器的关键技术,包括预处理、特征提取、分类模型、评价方法等进行了探讨.提出了基于向量空间模型的网页分类器的结构流程图,...
张东礼汪东升郑纬民
关键词:中文网页分类向量空间模型
文献传递
基于VSM的中文文本分类系统的设计与实现被引量:58
2003年
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。
张东礼汪东升郑纬民
关键词:文字信息处理中文文本分类系统VSM向量空间模型特征提取
共1页<1>
聚类工具0