石崇德
- 作品数:28 被引量:80H指数:5
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家自然科学基金国际科技合作与交流专项项目北京市重点学科建设基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 一种基于判别随机场模型的行为建模方法
- 本文提出了一种基于判别式随机场模型的行为建模方法。在条件随机场模型的基础上,引入基于行为的隐藏特征函数和时间窗口参数,从而将其扩展到空间和时间的领域中,并设计了有效的特征模板和行为识别方法。由于模型具有基于条件的结构,该...
- 黄天羽石崇德李凤霞
- 关键词:CRF
- 文献传递
- 面向科技文献神经机器翻译词汇表优化研究被引量:2
- 2019年
- 【目的】针对面向科技文献的神经机器翻译中存在的词汇表受限问题,提出优化方法,进而提升翻译质量。【方法】根据科技词汇构词规律,结合点互信息,在保留词汇义素完整的同时,对神经机器翻译词汇表进行优化,达到减少未登录词的目的。【结果】选择NTCIR-2010专利语料和自动化计算机领域期刊论文摘要语料进行实验,将实验结果与普通分词和子词分词对比,证明该方法的有效性。【局限】仅考虑中文字符的优化。【结论】在中文科技文献领域,基于科技词汇构词的词汇表优化方法能够提升翻译效果。
- 刘清民姚长青石崇德温晓洁孙玥莹
- 关键词:未登录词
- 本体驱动的汉英机器翻译研究
- 在基于知识的机器翻译(Knowledge-basedMachineTranslation)中,语义的表达与分析占据着非常重要的地位,然而经过多年的探索,这个问题仍然没有得到有效的解决。而本体的出现为解决这个问题提供了新的...
- 石崇德
- 关键词:机器翻译语义分析本体汉英翻译
- 文献传递
- 树转录翻译模型解码优化
- 2013年
- 针对树转录翻译模型中的规则二元化和解码算法进行深入研究,通过四分化的二元化转换方法减少词汇化同步转录规则的中间项目,通过实时判断中间项目有效性的RR-CKY算法来避免冗余项目生成。实验证明,这两种方法能有效减少解码过程中的中间项目,提高机器翻译解码效率,在一定程度上提高机器翻译效果。
- 石崇德乔晓东王惠临
- 关键词:机器翻译句法分析
- 机器翻译系统融合方法及其应用探究
- 2011年
- 多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。
- 何彦青石崇德于薇张均胜王惠临
- 关键词:机器翻译自然语言处理
- 中文科技文献切分的领域适应技术研究
- 2014年
- 以生物医学文献为实例对象,研究科技文献切分中的领域适应技术,通过以词典特征、领域词汇特征、子串标注和使用词典切分的粗切分语料作为训练语料等方法,实现基于序列标注的中文切分方法由新闻领域到科技领域的适应,并取得了较好的效果。研究表明,在科技文献切分中,充分利用领域知识获取领域相关特征,对于提高科技文献切分的准确率具有重要的作用。
- 石崇德乔晓东王惠临屈鹏
- 一种基于短文本相似度计算的主观题自动阅卷方法被引量:12
- 2014年
- 文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
- 张均胜石崇德徐红姣高影繁何彦青
- 关键词:相似度主观题自动阅卷
- 专利检索系统中可视化查询的比较研究被引量:2
- 2015年
- 专利检索是一个非常复杂的过程,用户为了迅速高效地完成检索任务需要得到支持。专利检索过程的许多环节可以借助一些工具完成,其中就包括查询(式)构造工具。查询构造是一项高度依赖人工的任务,工具只能实现对可能有用数据进行预先计算,并针对用户进行可视化。信息检索系统中,查询过程和查询结果可视化的方式有很多。本研究提出了两种典型的原型系统设计,用于在专利检索过程中对不同的查询表达式进行比较。原型包含查询表达式构造因素和结果集大小因素,两种因素对于专利领域专家探究查询表达式的调整对检索效率的影响至关重要。本文开发的系统有助于在专利检索过程中对复杂查询表达式进行逐步优化,系统设计思想基于了领域专家型知识工程。
- Julia J.Jürgens周雷李颖孟令恩石崇德何彦青
- 关键词:信息可视化信息检索
- 统计机器翻译中文分词优化技术研究被引量:4
- 2012年
- 研究分词在统计机器翻译中的影响因素,分析不同分词对机器翻译词对齐模型的影响,提出基于粒度约束和子串标注的分词优化方法,并通过优化分词提高机器翻译的效果。
- 石崇德王惠临
- 关键词:中文分词机器翻译
- 文本信息的翻译方法、装置及终端设备
- 本申请涉及自然语言处理领域,公开了一种文本信息的翻译方法、装置、终端设备及计算机可读存储介质,其中,文本信息的翻译方法包括:对待翻译文本信息进行解析,确定待翻译文本信息的主题文本与版式信息;基于主题文本与版式信息,确定待...
- 石崇德何彦青许德山
- 文献传递