韩习武
- 作品数:25 被引量:33H指数:3
- 供职机构:黑龙江大学更多>>
- 发文基金:国家自然科学基金黑龙江省博士后科研启动基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 再论语言的层次结构——语义层在语言研究中的地位
- 2004年
- 语言的层次结构一直是各语言学派首要解决的问题,本文在总结前人观点的基础上,结合当代语言学和其它同语言学相交叉的学科的发展,尝试提出以语义为中心的语言层次结构模式,并阐述了该模式的理论意义和部分应用设想。
- 韩习武
- 关键词:语言研究语言学派语义语言层次论语
- 基于弱指导SVM的汉语动词次范畴化自动获取被引量:3
- 2006年
- 动词次范畴化自动获取过程主要涉及到两个典型步骤一、依据启发性规则生成次范畴化假设;二、应用统计方法对假设集合进行过滤,选择可靠的次范畴化类型。此前改进获取性能的研究都集中在统计过滤阶段,并且相关实验的假设生成阶段都没有涉及到有指导的训练过程,因此所有这些方法都是无指导的。文章提出一种弱指导的汉语动词次范畴化自动获取方案,并应用SVM分类器取代原系统中的无指导假设生成模块。实验结果表明,最终获取性能有了统计意义上的改善。
- 韩习武赵铁军
- 关键词:汉语动词次范畴化SVM
- NLP领域粗糙假设空间的统计优化
- 2005年
- 本文尝试总结出一类通过优化粗糙假设空间而学习近似目标概念的自然语言处理(NLP)问题的解决方法。自然语言的结构、意义和应用复杂多变,这使得NLP目标概念本身就不很明确,更难于从目标概念出发构造偏序假设空间。因此我们从NLP训练样本出发,以较为简单明确的语言学知识为启发,生成例(token)无偏的粗糙假设空间H,然后以型(type)频率为偏序对H进行统计优化,直至得到可以"可能近似正确"表示目标概念的变型空间H。
- 韩习武赵铁军
- 关键词:NLP
- 面向特定领域的汉语句法主干分析被引量:14
- 2004年
- 本文提出了一种面向特定领域的汉语句法主干分析方法。该方法中包括浅层句法分析、模板匹配两个关键环节 ,形成用模板表示的句法主干。在浅层句法分析中 ,本文使用了级联的隐马尔可夫模型进行了短语的归并 ;而后以已有的汉语句子模板为基础 ,进行模板匹配以达到句法主干分析的目标。在针对体育新闻领域语料的开放测试中 ,模板匹配的精确率和召回率分别达到了 98 0 4 %和 81 4 3% ,句子级的精确率和召回率分别达到了 96 97%、84 85 % 。
- 齐浩亮杨沐昀孟遥韩习武赵铁军
- 关键词:人工智能自然语言处理浅层句法分析
- 汉英动词次范畴化对应关系的形式描写
- 动词次范畴化及其自动获取的研究已经在英、汉等很多语种里取得了较好的科研成果,但跨语言的次范畴化研究仍然很少,并且不成体系。针对跨语言次范畴化信息自动获取的计算语言学任务,综合分析了汉英单语动词次范畴化的描写形式,结合词汇...
- 韩习武王金勇
- 关键词:跨语言
- 文献传递
- 动词次范畴化形式描写的语义与句法
- 2008年
- 动词次范畴化现象普遍存在于自然语言的语义和句法形式之中,是计算语言学研究的关键性内容之一。恰当的动词次范畴化形式描写将有利于自然语言信息的逻辑表述、计算机自动处理以及动词词汇化知识的获取和应用。本文试从语言认知和言语生成的角度讨论动词次范畴化形式描写中语义和句法的关系,提出属性划分和子类对应的解决方案。
- 韩习武
- 关键词:语义属性句法属性
- 超输入动作抓录系统及抓录方法
- 超输入动作抓录系统及抓录方法,它涉及超输入动作抓录系统及抓录方法。它实现了目前输入法未实现的对超输入行为的抓录。该抓录系统包括输入SAC兼容信息的输入装置;捕获所输入字符的装置;捕获所输入非字符的装置;将所捕获的输入字符...
- 姚亮孔醍韩习武
- 文献传递
- 双语词典在统计机器翻译中的应用
- 2010年
- 在当前的基于统计的翻译方法中,双语语料库的规模、词对齐的准确率对于翻译系统的性能有很大的影响。虽然大规模语料库可以改善词语对齐的准确度,提高系统的性能,但同时会以增加系统的负载为代价,因此目前对于统计机器翻译方法的研究在使用大规模语料库的基础上,同时寻求其他可以提高系统性能的方法。针对以上问题,提出一种把双语词典应用在统计机器翻译中的方法,不仅优化了词对齐的准确率,而且得出质量更高的翻译结果,在一定程度上缓解了数据稀疏问题。
- 王丽韩习武
- 关键词:统计机器翻译双语词典双语语料库
- 基于加权子序列核函数的次范畴论元分析
- 2010年
- 为提高汉语动词次范畴化框架(SCFs)的分析性能,提出了一种新的次范畴论元分析方法。该方法引入了基于间隙加权子序列的核函数,以传统规则的右部作为分类类别,将规则左部作为问题输入空间,将原本规则推导的问题转化为机器学习问题。由于间隙加权子序列核函数可以考虑跨距离的词之间的依赖关系,加之机器学习方法的引入,使得论元识别精度从55.16%提到了93.43%,并且极大提高了次范畴整句获取精度。
- 朱聪慧赵铁军韩习武郑德权
- 面向体育领域的句子主干翻译技术研究被引量:1
- 2005年
- 为了有效翻译体育领域文本,特别是文本中的长句,本文提出了一种面向体育领域的句子主干翻译方法。该方法采用模板来表示句子主干,主要包括句法主干分析、模板转换和句子主干译文生成三个步骤。本文研究中特别针对体育领域的语言特点进行了模板的设计和获取;在译文生成过程中,则分别利用规则和模板,采用了短语级全译和句子级摘译相结合的混合生成策略,并引入翻译函数来处理形态变化。实验结果表明句子主干翻译方法能够获取句子的关键信息,在可懂度上优于完全翻译,其忠实度也令人满意,是处理体育领域文本的有效方法。
- 薛永增杨沐昀赵铁军韩习武齐浩亮
- 关键词:人工智能机器翻译体育领域