您的位置: 专家智库 > >

北京语言大学信息科学学院语言信息处理研究所

作品数:70 被引量:369H指数:12
相关作者:刘智颖牟小峰李晟朱小杰罗镭贾更多>>
相关机构:北京工业大学计算机学院北京外国语大学中国外语教育研究中心中山大学国际汉语教材研发与培训基地更多>>
发文基金:国家自然科学基金教育部科学技术研究重点项目国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>

文献类型

  • 38篇会议论文
  • 30篇期刊文章
  • 1篇专利
  • 1篇科技成果

领域

  • 44篇自动化与计算...
  • 27篇语言文字
  • 5篇文化科学
  • 2篇电子电信
  • 1篇经济管理

主题

  • 11篇汉语
  • 8篇语料
  • 8篇语料库
  • 7篇分词
  • 7篇标点
  • 6篇中文
  • 6篇自然语言
  • 6篇词语
  • 5篇英语
  • 5篇计算机
  • 4篇动词
  • 4篇语言
  • 4篇语言处理
  • 4篇数据稀疏
  • 4篇自动分词
  • 4篇自然语言处理
  • 4篇作文
  • 4篇相似词
  • 3篇信息处理
  • 3篇语言模型

机构

  • 70篇北京语言大学
  • 7篇北京工业大学
  • 4篇中国人民解放...
  • 2篇北京外国语大...
  • 2篇中国科学院
  • 2篇中国电子信息...
  • 1篇广东金融学院
  • 1篇北京大学
  • 1篇首都体育学院
  • 1篇中山大学

作者

  • 40篇宋柔
  • 13篇罗智勇
  • 11篇荀恩东
  • 9篇尚英
  • 7篇王洁
  • 6篇熊文新
  • 6篇卢达威
  • 5篇苗传江
  • 4篇颜伟
  • 4篇邢富坤
  • 3篇葛诗利
  • 3篇张榕
  • 3篇张瑞朋
  • 3篇牟小峰
  • 2篇袁琦
  • 2篇修驰
  • 2篇刘智颖
  • 1篇陈潇潇
  • 1篇程东元
  • 1篇雒自清

传媒

  • 9篇中文信息学报
  • 3篇计算机科学
  • 3篇第二届HNC...
  • 3篇全国第八届计...
  • 2篇计算机研究与...
  • 2篇情报学报
  • 2篇计算机工程与...
  • 2篇第四届全国学...
  • 2篇第九届全国计...
  • 2篇第十届全国计...
  • 1篇世界汉语教学
  • 1篇语言教学与研...
  • 1篇中国语文
  • 1篇北京大学学报...
  • 1篇北京工业大学...
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇外语电化教学
  • 1篇科学学研究
  • 1篇语言研究

年份

  • 1篇2019
  • 1篇2018
  • 1篇2017
  • 1篇2015
  • 5篇2014
  • 2篇2013
  • 1篇2012
  • 2篇2011
  • 5篇2010
  • 4篇2009
  • 7篇2008
  • 9篇2007
  • 6篇2006
  • 10篇2005
  • 8篇2004
  • 7篇2003
70 条 记 录,以下是 1-10
排序方式:
广义话题结构理论视角下话题自足句成句性研究被引量:4
2014年
话题自足句是在广义话题结构理论的基础上定义的。话题自足句的成句性是广义话题结构的重要性质之一。该文在38万字不同语体的广义话题结构语料库中对话题自足句的成句性进行了实证性调查,发现有少量话题自足句不成句,对不成句现象进行了分析、分类,并提出了使其成句的办法。这将进一步完善广义话题结构理论,并能提高使用话题自足句的应用系统的性能。
尚英宋柔卢达威
藏族人名汉译名识别研究被引量:3
2009年
藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂 其次,藏族人名中含有大量高频单字,使得藏族人名和普通词语之间歧义冲突变得十分突出,同时也使得藏族人名和上下文之间的边界变得非常模糊。本文在大规模藏族人名实例和语料库调查基础上,统计分析了藏族人名的用字(串)特征,并构建了藏族人名属性特征库 通过藏族人名的命名规则及属性特征将藏族人名形式化表示,实现了藏族人名汉译名自动识别系统。真实语料库开放测试F值达到87.12%。
罗镭贾宋柔朱小杰
关键词:未登录词自动分词
基于规则的名词短语预调序
短语预调序是提高机器翻译效果的有效手段。本文通过对英汉翻译中名词短语结构的分析,总结得到名词短语调序规则,通过将这些规则进行短语预调序,提高了最终的翻译效果。为了缓解专家规则覆盖范围太大的弊端,本文从大规模双语语料中自动...
牟小峰荀恩东
文献传递
信息检索需求描述中的词语区域凸显
2008年
根据对当前主流信息检索测试Query的形式和内容分析,通过正则表达式将SGML形式的Query表述区分为不同描述域和主题功能块,针对处于不同区域的词语实施不同的加权策略。实验表明,结合主题词语的区域凸显和TF×IDF的加权方法比单纯TF×IDF方法MRR值高出26.67%。
熊文新宋柔
关键词:信息检索功能块
从广义话题结构考察汉语篇章话题认知复杂度被引量:10
2014年
语言理解问题从认知的角度已有大量的研究,但针对汉语的研究却很少。由于认知实验操作复杂,不容易大规模复制,因此难以量化其结论的普遍性以及对语言事实的覆盖度。该文尝试模拟人补足汉语篇章片段中话题-说明信息的过程,建立广义话题结构认知机模型,并通过认知机对大规模汉语语料进行定量分析,考察汉语标点句的话题认知所需的记忆资源及认知局限性。用作统计特征量的广义话题结构特征有标点句的深度、话题结构内折返度、话题栈深度、话题栈折返度、搁置区使用量。统计数据可从认知行为的视角得到合理解释。该文一方面揭示了说汉语者的话题认知能力的表现和局限性,另一方面又说明了广义话题结构认知机是话题认知的合理模型。
卢达威宋柔尚英
关键词:汉语篇章
相似词及其在计算机辅助校对系统中的应用
统计方法在自然语言处理的多种应用中取得了令人瞩目的成果,但数据稀疏问题限制了应用系统性能的提高。把统计单位由词提升到词类有助于缓解数据稀疏问题,但是传统的词类体系并不能反映词语在线性邻接(ngram)特征上的相似关系,而...
罗智勇宋柔
关键词:数据稀疏相似词计算机辅助校对
文献传递
中间语言转换过程中的增强处理被引量:3
2005年
在基于中间语言的多语信息交流平台中,确保自然语言表述的信息内容能正确地转换为相应的中间语言表示非常重要。作者在引入子语言后,将源语转换和目标语生成过程结合起来,人机交互的界面处理既提升了源语信息转换的准确性,又提高了目标语生成的自然度,从而进一步增强了多语信息交流平台的可行性。
熊文新袁琦
关键词:中间语言交互操作
基于“固结词串”实例的中文分词研究被引量:5
2012年
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的问题。CRF虽然可以消除大部分原有的分词歧义,却会带来更多新的错误切分。该文尝试找到一种简单的、基于"固结词串"实例的机器学习方法解决分词歧义问题。实验结果表明,该方法可以简单有效的解决原有的分词歧义问题,并且不会产生更多新的歧义切分。
修驰宋柔
关键词:中文分词CRF分词歧义
跨标点句的否定辖域
现代汉语中基本否定词“不”以及扩充否定词“从不”、“很不”、“不能”、“不会”等的否定辖域受到学术界重视,但前人研究一般都局限于句内,其实否定辖域也涉及多个标点句。跨标点句的否定辖域和否定词共享问题是整个跨标点句句法共享...
张瑞朋宋柔
关键词:否定词辖域共享
文献传递
国外自动作文评分技术研究被引量:36
2007年
写作是英语测试中的重要部分,也是提高英语水平的重要手段;但是作文批改需要大量人力、物力,又难以避免其主观性本质。基于统计、自然语言处理以及人工智能技术的自动作文评分给这一问题的解决带来了希望。本文综述国外主流自动作文评分技术,探讨其应用于中国英语学习者作文评分的前景。
葛诗利陈潇潇
关键词:中国英语学习者英语作文自然语言处理
共7页<1234567>
聚类工具0