王浩畅
- 作品数:72 被引量:195H指数:6
- 供职机构:东北石油大学计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学生物学医药卫生更多>>
- 基于预训练模型的关系抽取研究综述被引量:3
- 2023年
- 近年来随着深度学习技术的不断革新,预训练模型在自然语言处理中的应用也越来越广泛,关系抽取不再是单纯地依赖传统的流水线方法。预训练语言模型的发展已经极大地推动了关系抽取的相关研究,在很多领域已经超越了传统方法。首先简要介绍关系抽取的发展与经典预训练模型;其次总结当下常用的数据集与评测方法,并分析模型在各数据集上的表现;最后探讨关系抽取发展的挑战与未来研究趋势。
- 王浩畅刘如意
- 关键词:关系抽取特征抽取自然语言处理
- 生物文本中蛋白质名称的识别被引量:2
- 2007年
- 随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长,因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫,识别生物文献中的命名实体如蛋白质、基因、脱氧核糖核酸名称等成为生物信息学中信息抽取的最基本任务。介绍了国际同类研究中生物命名实体识别的各种方法,重点介绍了蛋白质名称识别的相关方法、所用资源、实验结果及与国际同类研究的比较结果。
- 王浩畅赵铁军于浩
- 关键词:生物信息命名实体识别
- 基于TSVM与主动学习融合的蛋白质交互作用关系抽取
- 2009年
- 针对蛋白质交互作用关系(PPI)抽取研究中已标注语料有限而未标注生物医学自由文本易得的问题,进行了基于直推式支持向量机(TSVM)与主动学习融合的蛋白质交互作用关系抽取研究。通过自主选择最优的未标注样本加入到TSVM的训练过程中,最大程度地提高了系统的性能。实验结果表明,TSVM与主动学习融合的算法在少量已标注样本和大量未标注样本组成的混合样本集上取得了较好的学习效果,与传统的支持向量机(SVM)和TSVM算法相比,能有效地减少学习样本数,提高分类精度,在AImed语料上取得了F测度为64.12%的较好性能。
- 刘健苗王浩畅赵铁军
- 关键词:半监督学习
- 面向文本分类的特征词选取方法研究被引量:1
- 2023年
- 基于文本分类的特征词选取是自然语言处理中最基础,也是最重要的内容之一。其目的主要是从一个文本中抽取出特征词,以此来表示文本信息,使其从相对无结构的文本转化为具有一定结构以便计算机可以识别并进行处理的信息。论文分别运用朴素贝叶斯及fastText两种分类方法,进行文本特征词提取与分类方法研究。实验结果表明,在文本分类精度与效率上,fastText算法表现最佳,但在样本属性相关性较小时,朴素贝叶斯性能最佳。
- 李鹏飞王辉Marius.Petrescu王浩畅
- 关键词:文本分类朴素贝叶斯
- 中文语法自动纠错系统的研究与实现被引量:6
- 2020年
- 文章将从中文语法错误修正中进行解释,主要包括以下几个部分:①语料库的编写,基于高质量的汉语语料库,通过机器学习进行语法错误特征分析和语料库纠错方法,基于模型进行训练;②预处理数据,消除数据噪声,从而获得高质量的数据;③语法错误,句子分割前的自动分割和词性标注,通过提高分词的正确性来提高语法错误识别的准确性;④建立N-Gram模型并基于CRF模型检测语法错误。
- 王浩畅周锦程
- 关键词:分词N-GRAM
- 基于云计算理念打造大庆高校教育云平台
- 2016年
- 近年来,由于高校信息化在建设过程中存在许多问题,因此本文以大庆各高校为例,提出并打造一种基于云计算理念的高校教育云平台,以有效解决高校信息化建设存在的问题。
- 潘俊辉王辉张强王浩畅
- 关键词:云计算高校
- 基于统计学习的生物医学文本信息抽取方法研究
- 生物医学文本信息抽取是生物医学研究中不可缺少的环节,有关生物医学的最新信息大部分以文献的形式存在,随着统计学习技术和自然语言处理技术的发展,采用归纳统计的方法从文本中发现知识已经成为可能。因此采用信息抽取技术从生物医学文...
- 王浩畅
- 关键词:统计学习生物医学文本信息抽取方法
- 文献传递
- 基于改进的CBOW与BI-LSTM-ATT的文本分类研究被引量:4
- 2021年
- 特征词的选取与文本表示是文本分类信息预处理的核心问题之一,鉴于此,论文提出一种改进的加权连续词袋模型(CBOW)与基于注意力机制的双向长短期记忆网络模型(BI-LASM-ATT)应用于文本分类研究。该模型以词频作为特征选择依据,改进了频次与反频次,利用加权CBOW模型得到词向量表示,作为BI-LSTM-ATT模型的词嵌入层,得到Soft⁃max分类器分类结果。论文在复旦大学提供的语料集的实验结果表明,该模型在文本分类的精确率、召回率、F_meature效果对比中,比传统机器学习和深度学习算法均有明显提高。
- 王辉潘俊辉王浩畅张强张岩
- 关键词:文本分类
- 一种防遗失的U盘
- 本实用新型涉及的是一种防遗失的U盘,这种防遗失的U盘由U盘本体和USB插口组成,U盘本体的外壳上设置有红外热释感应器和报警器,U盘本体内设置有报警芯片,红外热释感应器连接报警芯片,报警芯片连接报警器。本实用新型在用户离开...
- 王辉潘俊辉唐世伟王浩畅周喜红
- 文献传递
- 生物医学文本中命名实体识别的智能化方法
- 介绍了使用机器学习方法进行生物医学文本命名实体识别的技术,包括Generalized Winnow算法、支持向量机方法和条件随机域模型.根据学习算法的特点,识别过程中使用了丰富的特征集,包括局部特征、全文特征及外部资源特...
- 王浩畅赵铁军刘延力于浩
- 关键词:命名实体识别支持向量机条件随机域
- 文献传递