曹倩
- 作品数:3 被引量:48H指数:2
- 供职机构:南京大学更多>>
- 相关领域:自动化与计算机技术自然科学总论文化科学更多>>
- 汉语自动分词研究及其在信息检索中的应用被引量:46
- 2004年
- 汉语自动分词问题是中文信息检索的基础问题,也是阻碍其向前发展的“瓶颈”问题。介绍了分词技术的发展状况,分析了分词技术在信息检索过程中的应用,并讨论了信息检索和分词技术结合的方式和需要以及解决的关键技术问题。
- 曹倩丁艳王超潘金贵
- 关键词:汉语分词分词模型歧义分析中文信息检索
- 基于文本结构分析的中文自动摘要技术
- 面对当今日益增多的在线文本,如何压缩信息量,从而帮助人们快速有效的选择和利用感兴趣的信息,成为文本处理领域所关注的焦点。文本摘要作为一种重要的文本处理技术和文本压缩技术,旨在将全文压缩为一个意义完整、简洁连贯的短文,便于...
- 曹倩
- 关键词:自动文本摘要文本特征抽取中文自动分词潜在语义分析
- 文献传递
- 基于Ontology和EM方法的网页分类研究被引量:2
- 2003年
- 1.引言
当前,Internet上广泛流行的各种搜索引擎,为人们寻找资源提供了便利,而且还辅以各种用于提高精确度的技术,但普遍缺乏导引能力,即不能帮助用户确定所需信息所在的领域,使得获得的结果经常是风马牛不相及.所以,目前迫切需要的就是开发一种智能化、个性化的搜索工具,使其能够满足不同用户对不同领域的信息进行发现和积累的要求.
- 丁艳曹倩王超潘金贵
- 关键词:网页分类TFIDFEM