李思
- 作品数:79 被引量:23H指数:3
- 供职机构:北京邮电大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划高等学校学科创新引智计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信医药卫生更多>>
- 一种基于常识和推理的中文缺失代词补全方法
- 本发明公开了一种中文缺失代词补全方法,属于信息处理领域,该方法的特征包括:构建输入文本以及上下文文本矩阵;循环神经网络分别形成输入文本语义信息矩阵和输入文本上下文句子层面、词语层面语义背景矩阵;基于语义相似度得到输入文本...
- 佟见卓李思高升杨婧璇徐雅静
- 文献传递
- 一种适用图文知识图谱的关系抽取方法
- 本发明公开了一种适用图文知识图谱的关系抽取方法及系统,属于信息处理领域。该方法的特征包括:首先物体检测系统得到物体集合以及视觉短语特征,再同时分别经过视觉短语系统和翻译嵌入系统得到图像视觉特征和图像语义特征,最终经过分类...
- 李思李智超曾景城高升徐雅静
- 文献传递
- 一种基于神经网络推理的中文缺失代词补全方法
- 本发明公开了一种中文缺失代词补全方法,属于信息处理领域,该方法的特征包括:构建输入文本矩阵;循环神经网络形成输入文本语义信息矩阵;构建输入文本上下文文本矩阵;循环神经网络形成句子层面、词语层面两个输入文本上下文语义信息矩...
- 杨婧璇李思佟见卓高升徐雅静
- 文献传递
- 基于BART噪声器的中文语法纠错模型被引量:8
- 2022年
- 在中文语法纠错中,基于神经机器翻译的方法被广泛应用,该方法在训练过程中需要大量的标注数据才能保障性能,但中文语法纠错的标注数据较难获取。针对标注数据有限导致中文语法纠错系统性能不佳问题,提出一种基于BART噪声器的中文语法纠错模型——BN-CGECM。首先,为了加快模型的收敛,使用基于BERT的中文预训练语言模型对BN-CGECM的编码器参数进行初始化;其次,在训练过程中,通过BART噪声器对输入样本引入文本噪声,自动生成更多样的含噪文本用于模型训练,从而缓解标注数据有限的问题。在NLPCC 2018数据集上的实验结果表明,所提模型的F0.5值比有道开发的中文语法纠错系统(YouDao)提高7.14个百分点,比北京语言大学开发的集成中文语法纠错系统(BLCU_ensemble)提高6.48个百分点;同时,所提模型不增加额外的训练数据量,增强了原始数据的多样性,且具有更快的收敛速度。
- 孙邱杰梁景贵李思
- WEB观点挖掘中关键问题的研究
- 随着互联网的广泛普及和应用,网络已经成为众多网民生活的一部分。海量用户通过网络发布信息,使得带有观点的文本呈爆炸式增长。同时,用户也希望通过网络获取新的资讯和了解其他人的观点。然而,由于网络中的数据规模异常庞大,用户的这...
- 李思
- 一种基于元学习的个性化对话改写方法
- 本发明公开了一种基于元学习的个性化对话改写方法,属于自然语言处理领域。该方法的基本思想是通过元学习减轻个性化对话改写中的过拟合问题。该方法的步骤包括:基于不同用户画像数据构建多个相关的个性化对话改写任务,通过元学习在相关...
- 孙忆南李思
- 一种基于策略价值网络和树搜索增强的命名实体识别方法
- 本发表公开了一种基于策略价值网络的命名实体识别方法,属于信息处理领域。该方法首先将命名实体识别的标注过程建模成马尔科夫决策过程(MDP),提出了一种新颖的基于强化学习的命名实体识别模型,称为MM‑NER。MM‑NER是第...
- 高升劳雅迪李思徐雅静陈光徐君胡旻卉
- 文献传递
- 一种中文事件的检测方法和系统
- 本发明提供了一种中文事件的检测方法,包括:将待检测文本转换成字符向量序列和词向量序列;将字符向量序列和词向量序列输入预先建立的中文事件检测模型,得到待检测文本的触发词以及对应的事件类型;其中,中文事件检测模型考虑了事件类...
- 谈元鹏宋磊李思徐会芳彭国政张锐刘剑青王凯王明轩朱明阳蓝海波李晶陆树栋王新迎乔骥张玉天赵紫璇王芳
- 文献传递
- 一种融合语义和标签差异的命名实体识别领域自适应的方法
- 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi‑LSTM+CRF模型的基础上,为了融合源领域和...
- 李思王蓬辉徐雅静李明正孙忆南
- 文献传递
- 基于数据增强的中文医疗命名实体识别被引量:11
- 2020年
- 由于缺乏大量已标注数据,在中文医疗命名实体识别中,主要利用外部资源来改善医疗实体识别的性能,这需要大量的时间和有效的规则加入外部资源.为了解决标注数据不足的问题,提出了一种基于生成对抗网络的数据增强算法,自动生成大量标注数据,提高医疗实体识别的性能.实验结果表明,该算法在性能方面优于实验中的基准模型,证明了该算法在医疗实体识别上的有效性.
- 王蓬辉李明正李思
- 关键词:命名实体识别