王浩畅
- 作品数:79 被引量:209H指数:6
- 供职机构:东北石油大学计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学生物学医药卫生更多>>
- 基于预训练模型的关系抽取研究综述被引量:4
- 2023年
- 近年来随着深度学习技术的不断革新,预训练模型在自然语言处理中的应用也越来越广泛,关系抽取不再是单纯地依赖传统的流水线方法。预训练语言模型的发展已经极大地推动了关系抽取的相关研究,在很多领域已经超越了传统方法。首先简要介绍关系抽取的发展与经典预训练模型;其次总结当下常用的数据集与评测方法,并分析模型在各数据集上的表现;最后探讨关系抽取发展的挑战与未来研究趋势。
- 王浩畅刘如意
- 关键词:关系抽取特征抽取自然语言处理
- 生物文本中蛋白质名称的识别被引量:2
- 2007年
- 随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长,因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫,识别生物文献中的命名实体如蛋白质、基因、脱氧核糖核酸名称等成为生物信息学中信息抽取的最基本任务。介绍了国际同类研究中生物命名实体识别的各种方法,重点介绍了蛋白质名称识别的相关方法、所用资源、实验结果及与国际同类研究的比较结果。
- 王浩畅赵铁军于浩
- 关键词:生物信息命名实体识别
- 基于TSVM与主动学习融合的蛋白质交互作用关系抽取
- 2009年
- 针对蛋白质交互作用关系(PPI)抽取研究中已标注语料有限而未标注生物医学自由文本易得的问题,进行了基于直推式支持向量机(TSVM)与主动学习融合的蛋白质交互作用关系抽取研究。通过自主选择最优的未标注样本加入到TSVM的训练过程中,最大程度地提高了系统的性能。实验结果表明,TSVM与主动学习融合的算法在少量已标注样本和大量未标注样本组成的混合样本集上取得了较好的学习效果,与传统的支持向量机(SVM)和TSVM算法相比,能有效地减少学习样本数,提高分类精度,在AImed语料上取得了F测度为64.12%的较好性能。
- 刘健苗王浩畅赵铁军
- 关键词:半监督学习
- 基于保险条款文本的知识图谱构建研究
- 2024年
- 为了方便人们在投保时能够更快速地对比不同产品的优缺点,论文提出一种基于保险产品条款文本的知识图谱构建方法。首先结合保险领域专家对保险产品设计相关的研究,分析条款中的要素并构建Schema层,接着将保险条款文件作为数据基础,使用BERT-BiLSTM-CRF模型抽取出其中的保险公司、保险产品、保险保障等实体,按照Schema中定义的实体关系和实体属性构造关系和属性的提取模板,最后将抽取出来的保险三元组存储至图数据库Neo4j中构成知识图谱。该方法能够快速有效地将条款文本转换为结构化的知识图谱,有利于推动保险领域智能化升级。
- 王浩畅宗杨
- 关键词:保险知识图谱命名实体识别
- 基于知网的词语语义相似度改进算法研究
- 2022年
- 词语语义相似度计算在很多自然语言处理相关领域都有着广泛应用。基于知网的现有词语语义相似度计算方法未深入考虑同棵义原层次树的义原距离、义原深度、义原密度及主次关系的影响,致使相似度计算结果并不够精确。针对该问题,提出一种词语语义相似度改进算法,通过分析知网中的义项表达式和义原层次树,用集合的加权平均值代替了义项相似度最大值,在新的边权重函数中引入义原密度,进而通过调节权重因子限制义原深度与义原密度对相似度计算准确度的影响。实验结果表明,改进后的算法有效提高了词语语义相似度准确率,取得了比较满意的结果,比现有方法更合理。
- 王辉Mariu.sPetrescu潘俊辉王浩畅张强
- 关键词:知网
- 基于文本的生物信息获取
- 随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长.因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫.我们的研究主要致力于两方面的内容:一个是命名实体的识别,另一个是实体关...
- 王浩畅赵铁军于浩
- 关键词:生物信息命名实体识别实体关系抽取
- 文献传递
- Hadoop平台下实现关联规则挖掘的优化算法被引量:1
- 2020年
- 目前如何从互联网上的海量数据中挖掘出有用的信息已经成为一个重要的研究方向,随着云计算的出现,分布式关联规则挖掘算法将能够更有效地解决当前的问题。论文针对关联规则挖掘的Apriori算法效率低的缺点,同时根据Hadoop平台对矩阵进行处理时所具有的优点,提出了一种Hadoop平台下的基于压缩矩阵的关联规则优化算法。该算法首先使用MapReduce计算模型对事务数据库进行分块,然后使用基于压缩矩阵的优化算法进行挖掘,最后对挖掘的结果进行合并操作,得到频繁项集。通过实验可得优化后的算法比传统算法在运算时间上有极大的提高。
- 潘俊辉张强王辉王浩畅
- 关键词:HADOOP关联规则APRIORIMAPREDUCE
- 面向文本分类的特征词选取方法研究被引量:1
- 2023年
- 基于文本分类的特征词选取是自然语言处理中最基础,也是最重要的内容之一。其目的主要是从一个文本中抽取出特征词,以此来表示文本信息,使其从相对无结构的文本转化为具有一定结构以便计算机可以识别并进行处理的信息。论文分别运用朴素贝叶斯及fastText两种分类方法,进行文本特征词提取与分类方法研究。实验结果表明,在文本分类精度与效率上,fastText算法表现最佳,但在样本属性相关性较小时,朴素贝叶斯性能最佳。
- 李鹏飞王辉Marius.Petrescu王浩畅
- 关键词:文本分类朴素贝叶斯
- 中文语法自动纠错系统的研究与实现被引量:6
- 2020年
- 文章将从中文语法错误修正中进行解释,主要包括以下几个部分:①语料库的编写,基于高质量的汉语语料库,通过机器学习进行语法错误特征分析和语料库纠错方法,基于模型进行训练;②预处理数据,消除数据噪声,从而获得高质量的数据;③语法错误,句子分割前的自动分割和词性标注,通过提高分词的正确性来提高语法错误识别的准确性;④建立N-Gram模型并基于CRF模型检测语法错误。
- 王浩畅周锦程
- 关键词:分词N-GRAM
- 基于云计算理念打造大庆高校教育云平台
- 2016年
- 近年来,由于高校信息化在建设过程中存在许多问题,因此本文以大庆各高校为例,提出并打造一种基于云计算理念的高校教育云平台,以有效解决高校信息化建设存在的问题。
- 潘俊辉王辉张强王浩畅
- 关键词:云计算高校