李一伟
- 作品数:3 被引量:6H指数:2
- 供职机构:兰州大学更多>>
- 发文基金:国家科技基础性工作专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于关键重复语义的最大熵文本分类被引量:2
- 2007年
- 文本分类做为Web文本挖掘的重要手段和搜索引擎的重要组成部分而被广泛研究。现有的分类系统大都依赖于中文分词,尽管达到分类目的,但随着Web文档数量的增加和网络新词汇的不断出现,面临着特征维数急遽增高带来的时空开销问题,严重影响了系统的性能。在此抛开中文分词而尝试使用基于关键子串的特征提取并结合最大熵模型给出了一种分类系统的实现。实验表明,与现有的分类系统相比,具有较好的问题求解效率和适应性。
- 屈志毅李一伟张延堂杨曙光张菲菲
- 关键词:文本挖掘文本分类最大熵模型特征提取
- 基于支持向量机的层次预测音乐自动分类及应用
- 随着互联网络的发展,越来越多的信息资源在网上发布共享,如何快速的发现和定位特定的网络资源,成为研究的一个重点,现有的第二代搜索引擎,百度,google,yahoo等为人们提供了文本信息检索服务,但随着用户需求的日益提高,...
- 李一伟
- 关键词:支持向量机搜索引擎
- 文献传递
- 基于本体的强对流天气查询系统被引量:3
- 2008年
- 在研究强对流领域信息查询的基础上,提出一个原型系统ontoWeather。该系统建立了气象强对流领域本体库,并构造强对流领域的推理规则。运用Jena实现该领域基于语义的检索功能,得出潜在的语义查询结果,为气象领域提高信息检索的查准率和查全率提供一个有效方法。
- 屈志毅张菲菲李一伟张延堂
- 关键词:本体语义检索强对流