韦向峰
- 作品数:54 被引量:52H指数:4
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家重点基础研究发展计划中国科学院声学研究所知识创新工程项目中国科学院知识创新工程青年人才领域前沿项目更多>>
- 相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
- 语义理解下的自然语言处理及信息检索模型被引量:7
- 2008年
- 本文从如何利用语义来构建理想信息检索系统的角度出发,以HNC自然语言理解体系为基础,给出了一种在这一体系下分步构建信息检索系统的实施方案。结合HNC在信息检索方面新近取得的研究成果,从理论和工程两个角度介绍了这一体系服务于信息检索的相关内容,讨论了其中几个重要模型的实现方法。最后沿着方案思路给出了在目前成果基础上进一步发展检索系统的展望。
- 吴晨张全缪建明韦向峰
- 关键词:信息检索自然语言理解语义HNC
- 汉语语句核心动词的自动获取研究
- 2007年
- 语句核心动词的自动获取是以动词为中心的汉语语句分析中的重要组成部分。依据概念层次网络理论,在字词概念符号的基础上获取候选动词集合,根据动词的上下文语言环境对动词进行排除和分类处理,对可能作为语句核心动词的动词集合按照作语句核心结构的可能性大小排队,并验证其正确性。实验结果表明,在从真实语料切分得到的3121个语句中,经过排队处理后前三个动词作为语句核心动词的正确率达到了83%。错误分析表明进一步完善知识库及排除排队规则,还可以提高自动获取语句核心动词的正确率。
- 韦向峰熊亮张全
- 关键词:概念层次网络动词
- 用户评价中比较句的识别和倾向性分析被引量:4
- 2016年
- 在互联网上用户评价内容中很多比较句的比较结果反映了语句陈述者对比较对象的倾向性态度。根据已有的10类比较句句型总结了它们的常见概念搭配,在基于语义块的语句倾向性分析方法的基础上构建了比较句自动识别系统和比较句倾向性自动分析系统。采用第四届中文倾向性分析评测的语料进行实验,对语料中的比较句进行了识别,对比较句中的要素进行了抽取并且分析了比较句的倾向性,识别结果和倾向性分析结果均好于所有参评系统的平均值。
- 吴晨吴晨
- 关键词:用户评价比较句
- 基于HNC理论的汉语辅语义块自动辨识研究被引量:2
- 2009年
- 全自动的语义分析一直是自然语言处理的主要目标之一,通过深层语义的分析,自然语言可以转化为形式语言。因此,可以实现人机之间的交互。为达到此目的人们在语义分析和标注方面做了长期的努力。本文在借鉴前人工作的基础上,为提高辅语义块的自动识别,进行了大量的语料分析,总结提出了比较有效的计算机处理规则。经真实文本实验测试,利用这些规则处理,可以达到较好的准确率和召回率。
- 臧翰芬韦向峰张全
- 基于语义结构平行的汉语人称代词消解
- 如何让计算机根据自然语言的语义表示消解句子乃至段落篇章中的人称代词,一直是自然语言处理的一大难题。本文依据HNC理论的句类表达式和语义块构成的相关知识,提出了一种基于语义结构平行的人称代词消解算法,通过定义句子语义块的层...
- 臧翰芬韦向峰张全
- 关键词:人称代词指代消解HNC理论
- 文献传递
- 富媒体环境下语音和文本内容的对齐研究被引量:1
- 2019年
- 语音媒体和文本媒体是富媒体中重要的两种媒体,本文试图解决富媒体内容关联中语音和文本的自动对应和关联问题。本文通过自动语音识别、语音纠错处理、文本相似度计算等技术和方法,把语音和文本的对齐问题转化为文本之间相似和对齐的问题,通过从语音到文本、从文本到语音两种应用场景,用实验证明了该方法的可行性和有效性。本文的语音文本对齐技术将是富媒体融合特别是语音媒体和文本媒体之间进行融合的重要支撑技术,同时也为文本媒体和语音媒体的进一步关联重组和应用提供坚实的技术基础。
- 韦向峰袁毅张全池毓焕
- 关键词:富媒体语音识别
- 一种基于概念符号的文本领域的获取系统及方法
- 本发明公开了一种基于概念符号的文本领域的获取系统及方法。该系统包括:一用于表达词语概念和领域类别的概念符号集、一存储词语及其概念符号的词语知识库、一分词处理器、一语句语义分析器、一领域判别器。该方法包括以下步骤:(1)把...
- 韦向峰黄曾阳张全缪建明
- 文献传递
- 基于语义块的事件倾向性分析研究
- 事件的倾向性分析对网络舆情分析和事件趋势分析都具有重要意义。本文把影响倾向性分析的词语分为四类:对象词、褒贬词、逻辑词和程度词,建立了语句倾向性分析的二元模型和三元模型,在语句语义块分析的基础上实现对语句和篇章的倾向性获...
- 韦向峰张全缪建明池毓焕
- 关键词:语义块句类分析立场分析
- 文献传递
- 基于文本倾向性分析的文献推荐服务研究被引量:2
- 2011年
- 文献推荐服务已经成为数字图书馆的重要知识服务内容之一。本文引入自然语言处理中的文本倾向性分析技术,通过对引证文本的语句语义分析,把语句的语义结构转化为倾向性分析的二元或三元模型,得到引证文本对参考文献的主观评价信息。结合参考文献本身的正文中对其他文献的评论指数,给出了文献推荐度的计算方法,从而实现对文献集中文献的自动分析和推荐服务。实验表明基于文本倾向性分析的文献推荐服务是可以实现的,并具有较高的准确率。在实际应用中还需要扩大词语知识库的规模,并提高语句的语义结构分析、词语语义关系分析等方面的性能。
- 韦向峰张全
- 关键词:知识服务情感计算语义分析概念层次网络
- 英汉双语富媒体知识图谱构建工程研究——以CNS英文期刊为例
- 2023年
- [目的/意义]研究自动构建英汉双语富媒体知识图谱的方法和过程,为跨语言多模态知识图谱的自动构建提供借鉴参考,对及时获取最新英文科研成果、科技情报监测等具有重要意义。[方法/过程]采用自顶向下和自底向上相结合的方法,先从顶层设计要抽取的主要实体、属性和关系,从底层非结构化文本数据进行分析抽取细粒度的实体和属性,对有歧义实体和跨语言实体进行实体对齐,对跨媒体的实体进行实体链接,用图数据库实现知识图谱的存储及应用。[局限]未来需进一步提高细粒度实体的抽取正确率,对音视频媒体进行特征提取和内容自动识别。[结果/结论]以CNS(Cell、Nature、Science)等英文科技期刊网站为例,通过数据抓取、实体抽取、属性抽取、知识融合、跨媒体链接等过程,实现了英汉双语富媒体知识图谱的构建、存储和可视化展示。
- 韦向峰缪建明张全张全
- 关键词:富媒体知识图谱