杜一民
- 作品数:2 被引量:2H指数:1
- 供职机构:中国科学技术大学软件学院更多>>
- 发文基金:江苏省科技厅基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于介词向量的英语真词错误检查算法
- 2015年
- 在基于Winnow算法的基础上引入混淆词和介词搭配的方法.首先通过混淆集获得训练集,对训练集进行预处理后利用文本特征提取方法获得特征词集,然后对特征词集进行Winnow训练得到带有权重的特征词集并把出现在混淆词后的介词提取出来生成介词向量,最后从测试集提取特征并进行结合Winnow算法和混淆词与介词搭配方法的测试得到真词错误检查的结果.混淆词与介词搭配方法的加入使得某些混淆词的正确率、召回率以及F1测度提高了10%~20%,有的甚至提高到了100%.
- 霍娟娟吴敏吴桂兴郭燕陈朝才杜一民
- 关键词:介词WINNOW
- 一种解决英语动名词搭配错误的模型被引量:2
- 2016年
- 英语学习者易犯动名词搭配错误。通过分析CLEC中的动名词搭配错误,提出一种纠正中国学习者的动名词搭配错误的模型。首先构建了一个动名词搭配库,接着提出了一种度量搭配间的相似度的方法,通过计算目标搭配和搭配库的相似度得到粗略的相似搭配集,使用分类的方法过滤掉相似搭配集中不能将测试句划为正确类的搭配,得到候选结果集,最后使用语言模型对候选结果集打分排序,得到最终的纠正建议。在使用BNC构造的测试集上,这种综合相似性推理和上下文特征的方法对动名词搭配纠错具有显著效果。
- 杜一民吴桂兴吴敏
- 关键词:搭配错误语言模型