您的位置: 专家智库 > >

段亮

作品数:11 被引量:21H指数:3
供职机构:云南大学信息学院更多>>
发文基金:国家自然科学基金云南省教育厅科学研究基金中国博士后科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 11篇中文期刊文章

领域

  • 11篇自动化与计算...

主题

  • 2篇新闻
  • 2篇新闻事件
  • 2篇知识图
  • 2篇知识图谱
  • 2篇主题模型
  • 2篇贝叶斯
  • 2篇贝叶斯网
  • 2篇抽取
  • 1篇新闻线索
  • 1篇信息熵
  • 1篇循环卷积
  • 1篇舆情
  • 1篇语言处理
  • 1篇语言模型
  • 1篇指代消解
  • 1篇散度
  • 1篇神经网
  • 1篇神经网络
  • 1篇实体关系抽取
  • 1篇数据清理

机构

  • 11篇云南大学
  • 1篇成都信息工程...
  • 1篇昆明理工大学

作者

  • 11篇段亮
  • 10篇岳昆
  • 4篇段亮
  • 1篇乔少杰
  • 1篇袁国武
  • 1篇付晓东
  • 1篇覃远翔

传媒

  • 1篇计算机集成制...
  • 1篇南京大学学报...
  • 1篇河南师范大学...
  • 1篇计算机应用
  • 1篇软件学报
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇软件导刊
  • 1篇计算机技术与...
  • 1篇计算机科学与...
  • 1篇数据分析与知...

年份

  • 2篇2024
  • 4篇2023
  • 3篇2022
  • 1篇2021
  • 1篇2013
11 条 记 录,以下是 1-10
排序方式:
基于子事件的对话长文本情感分析被引量:2
2023年
传统的情感分析方法主要针对句子、微博等形式的短文本,而对话长文本具有篇幅长、对话双方情感不同且情感易随对话发生变化等特点,使对话长文本中用户多重情感集成困难、情感分析任务精度低.为此,提出子事件交互模型TSI(Topic Subevents Interaction)、预训练模型ERNIE(Enhanced Language Representation with Informative Entities)和循环卷积神经网络(Recurrent Convolutional Neural Networks,RCNN)相结合的对话长文本情感分析模型(TSIwith ERNIE-RCNN,TER).该模型通过动态滑动窗口抽取子事件,保留文本关键特征,降低文本冗余度,基于抽取的子事件分析对话双方的情感来识别情感主体,并集成各子事件的情感特征来解决对话双方情感不一致的问题.在真实数据上的实验结果表明,TER的精确率、召回率与F1均优于现有模型.
杨京虎段亮段亮岳昆
关键词:情感分析
基于BERT的民间文学文本预训练模型被引量:3
2022年
民间文学文本中含有大量生动形象的修辞手法;人名、地名极其复杂,难以判断词与词之间的边界;与现代汉语表达差别较大,预训练语言模型难以有效地学习其隐含知识,为机器自然语言理解带来困难。该文提出一种基于BERT的民间文学文本预训练模型MythBERT,使用民间文学语料库预训练,将BERT的字隐蔽策略改进为对中文词语隐蔽策略。对民间文学文本中解释字、词的注释词语重点隐蔽,减小BERT隐蔽的随机性并有利于学习词语语义信息。同时利用注释增强语言模型表示,解决一词多义、古今异义等问题。将MythBERT与BERT、BERT-WWM和RoBERTa等主流中文预训练模型在情感分析、语义相似度、命名实体识别和问答四个自然语言处理任务上进行比较。实验结果表明,注释增强的民间文学预训练模型MythBERT在民间文学文本任务上性能显著提升,与基线方法相比取得了最优的效果。
陶慧丹段亮段亮岳昆
关键词:自然语言处理
基于指代消解的民间文学文本实体关系抽取
2024年
民间文学是中华文化的重要组成部分,具有重要的研究价值。随着人工智能的快速发展,数字化技术成为修复民间文学残缺作品、构建民间文学领域知识图谱等实际应用的重要方式.然而,民间文学文本中指示代词多、实体关系重叠,使得民间文学文本关系抽取困难.为此,提出一种基于指代消解的实体关系联合抽取方法CR_RSAN,使用指代消解获取指示代词和对应实体的位置信息,并利用该信息设计指示代词替换算法和调整文本序列标注方法,以此强化模型获取文本语义特征的能力.此外,使用同时编码实体和关系信息的序列标注方法以缓解文本实体关系重叠问题.对比实验选用目前主流方法的模型作为基线,并相继在民间文学文本上进行实验,CR_RSAN在精确率、召回率和F1值等方面分别提高了13.39个百分点、14.29个百分点和14.98个百分点.
魏静岳昆段亮王笳辉
关键词:民间文学关系抽取指代消解注意力
面向文本识别的小样本阴影消除方法
2024年
阴影消除是计算机视觉领域中面对阴影场景的重要任务,旨在检测和消除图像中的阴影区域。由于图像编辑技术受到阴影图像质量的制约,现有方法利用其他任务中的知识和阴影特性来获得更加有效的特征向量,从而实现阴影消除。在带有文本内容的阴影图像中,由于文本颜色和形状等特征不同于前景和背景,因此可能将文本错误地检测为阴影的一部分进而导致错误的阴影消除结果。针对该问题,提出了一种面向文本识别的小样本阴影消除方法。在小样本目标检测基础框架模型中,利用被错误识别为阴影的文本特征生成基类数据和新类数据,增强对该类文本的特征学习;在部分检测框合并算法中,利用文本本身长宽比多样化、变化大的特性,以多个约束为前提合并结构相关性较强的检测框,实现对目标的正确框定。建立在真实数据与合成数据上的实验结果验证了所提方法的有效性。
王笳辉彭光灵段亮袁国武袁国武
关键词:文本识别目标检测
民间文学文本命名实体识别方法
2023年
民间文学文本命名实体识别任务旨在从民间文学文本中判别实体并将其划分到预定义的语义类别,为民间文学的保存与传播奠定基础。民间文学区别于一般中文语料,其文本存在一词多义情况突出与领域名词众多的问题,导致常规命名实体识别方法难以准确充分地识别出民间文学文本中存在的实体及其类别。针对该问题,提出一种基于BERT的民间文学文本命名实体识别模型TBERT。该模型首先在通用中文BERT模型的基础上融合民间文学文本语料特征与实体类型特征;然后利用BiLSTM模型进一步提取序列依赖特征;最后结合CRF模型获取的标签约束信息输出全局最优结果。实验结果表明,该方法在民间文学文本数据集上具有良好表现。
黄健钰王笳辉段亮冉苒
关键词:命名实体识别
基于Biterm主题模型的新闻线索生成方法被引量:4
2021年
【目的】为解决生成新闻线索时抽取新闻主题及度量子事件相关性困难的问题,通过动态滑动窗口的方法改进主题模型,提高长文本和短文本新闻主题抽取的质量,并基于抽取出的新闻主题,提出面向新闻事件的新闻线索生成方法。【方法】在主题模型IBTM(Incremental Biterm Topic Model)的基础上,通过动态滑动窗口减小二元词组的提取范围,提出既适合在长文本新闻也适合在短文本新闻上抽取主题的News-IBTM模型,进而基于该模型从新闻数据中抽取主题分布和主题-词分布、推断文档-主题分布,再利用JS散度来度量文档-主题分布的差异,从而生成新闻线索。【结果】在人民网新闻和微博新闻数据上的实验结果表明,无论是长文本新闻还是短文本新闻,News-IBTM在困惑度、准确率及效率上都优于现有的经典主题模型。【局限】News-IBTM以及其他新闻线索生成方法的准确率都不高,还可以进一步提升。【结论】本文方法适合应对长文本和短文本新闻主题抽取的质量问题,并能从新闻事件中获取新闻线索。
赵天资段亮岳昆乔少杰乔少杰
关键词:新闻事件主题模型
时序知识图谱的增量构建被引量:3
2022年
带有时序特征的知识图谱(KG)称为时序知识图谱,用来描述知识库中增量式的概念及其相互关系。知识随着时间推移而变化,将新增知识实时、准确地添加到时序知识图谱中,可以实时反映知识的演化更新。对此,给出时序知识图谱的定义,并基于TransH提出一种时序知识图谱的增量构建方法。为了将新增且相关的三元组准确地添加到当前知识图谱中,提出了三元组与当前知识图谱之间吻合度的计算模型,以及基于贪心思想的待添加到知识图谱中的最优三元组子集提取算法,进而将最优的三元组集合添加到当前知识图谱中,完成时序知识图谱的增量更新。实验结果表明,提出的增量构建方法能够快速地提取出最优三元组并有效地添加到知识图谱中,验证了方法的高效性和有效性。
张子辰岳昆祁志卫段亮
关键词:吻合度贪心算法
基于概率推理的知识图谱链接预测方法
2023年
为了有效发现实体间隐含的关联关系并对其进行量化,以全面准确地进行知识图谱(KG)链接预测,提出基于概率推理KG链接预测方法。该方法以描述实体间隐含关联关系并度量链接存在的可能性为目标,基于AMIE算法挖掘KG中的规则并将其转换为Horn子句,进一步构建描述不同实体依赖关系的规则链接贝叶斯网(RLBN),将KG的链接预测任务转换为RLBN的概率推理任务来计算实体间的关联度,从而预测实体间的链接关系。实验结果表明,基于RLBN的KG链接预测精确率和召回率优于其他方法,验证了所提模型的有效性与高效性。
姚建军李剑宇岳昆段亮段亮
关键词:知识图谱链接预测贝叶斯网HORN子句
基于信息熵的不确定性数据清理方法被引量:9
2013年
针对不确定性数据中往往包含一些异常数据而导致相应的查询结果出现错误的问题,提出了一种基于信息熵的不确定性数据清理方法以减少异常数据并提高不确定性数据的质量。首先使用信息熵来度量数据的不确定度,然后结合统计学方法计算出不确定性数据的可信区间,最后去除那些不在可信区间内的数据。实验结果验证了该方法的高效性和有效性。
覃远翔段亮岳昆
关键词:不确定性数据数据清理信息熵不确定度
基于自编码器的贝叶斯网嵌入及概率推理
2023年
贝叶斯网(BN)是不确定性知识表示和推理的基本框架,广泛用于社交网络、知识图谱和医疗诊断等领域.特定领域中基于BN的分析诊断和决策支持,其核心计算任务是基于BN进行多次概率推理.然而,使用传统的概率推理方法,基于同一BN的多次概率推理其中间过程存在很多重复的计算结果,具有较高的时间复杂度.为了提高多次概率推理的效率,提出易于重用和易于计算的贝叶斯网嵌入及相应的概率推理方法.首先,借鉴图嵌入的基本思想,使用点互信息矩阵来表示BN的有向无环图结构和条件概率参数,提出基于自编码器和注意力机制的BN嵌入方法.其中,自编码器的每一编码层利用节点与其邻居节点(父节点和子节点)的相关性生成节点嵌入,从而在嵌入向量中保存BN节点间的概率依赖关系.然后,使用嵌入向量之间的距离来度量节点之间的联合概率,提出基于嵌入向量的BN概率推理方法.实验证明,针对BN的多次概率推理,所提方法的效率高于现有方法,且能得到准确的推理结果.
杜斯祁志卫岳昆段亮段亮
关键词:贝叶斯网图嵌入
共2页<12>
聚类工具0