国家高技术研究发展计划(2009AA01Z136)
- 作品数:2 被引量:14H指数:1
- 相关作者:邓志鸿黄林晟唐世渭王忠辉更多>>
- 相关机构:北京大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向XML文档的二级索引技术及其在XML关键词检索中的应用研究
- 随着互联网上XML文档的大量增加,如何高效地索引、存储和检索这些XML数据成为一个非常值得深入研究的课题.目前,在XML关键词检索方面,主流的检索系统都是建立在一级索引的基础上.一级索引存在两个明显的缺点:1)索引的冗余...
- 向永清邓志鸿于航高宁
- 关键词:XML关键词检索
- 文献传递
- 基于编辑距离的中文组织机构名简称-全称匹配算法被引量:14
- 2012年
- 在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合重定义的词汇语义相似度度量方法,修改编辑操作权重,并通过自适应学习的方式进一步修正;最后选择与简称编辑距离最小的全称作为匹配结果。实验结果表明,该算法匹配准确率比原始方法有较大提升。
- 黄林晟邓志鸿唐世渭王文清陈凌
- 关键词:文本挖掘
- 综合社会行动者兴趣和网络拓扑的社区发现方法
- 随着Web 2.0技术的发展,大规模在线社会网络数据的获取成为了可能,这激发了众多研究者对社会网络的研究热情.近年来,社区发现成为社会网络领域的研究热点.研究了社会网络社区发现问题,提出了综合社会行动者兴趣和社会网络拓扑...
- 燕飞张铭谭裕韦唐建邓志鸿
- 关键词:社会网络聚类随机游走
- 文献传递
- 基于特征的用户评论自动摘要
- 电子商务网站允许用户对商品发表评论,用户评论通常含有用户对商品的主观性体验,常被潜在顾客作为比较不同商品并作出购买选择的参考,也可被生产厂商作为市场反馈调查的数据来源.然而,由于电子商务的发展,热门商品常常拥有成百甚至上...
- 章彦星张铭邓志鸿
- 关键词:频繁项集句子抽取
- 文献传递
- COMP:一个中文网络评价信息挖掘系统
- 2009年
- 网络中大量的评价信息有着重要的利用价值,评价挖掘技术可以自动地挖掘出这些评价信息中所蕴含的评价者对评价对象的态度和意见。为此,设计实现了一个面向中文网络信息的评价挖掘原型系统COM P,实验表明该系统的挖掘结果具有一定的参考价值和实际意义。
- 王忠辉邓志鸿
- 关键词:情感分析特征提取网络信息服务