黄瑞章
- 作品数:146 被引量:163H指数:7
- 供职机构:贵州大学更多>>
- 发文基金:国家自然科学基金贵州省科学技术基金贵州省科技厅重大专项更多>>
- 相关领域:自动化与计算机技术文化科学政治法律经济管理更多>>
- 一种基于层次狄利克雷多项分配模型的多源文本聚类方法
- 本发明公开了一种基于层次狄利克雷多项分配模型的多源文本聚类方法,所述方法包含有如下步骤:一、从多个来源收集文本集;二、将来自多个数据源的文本信息进行文本预处理;三、基于层次狄利克雷多项分配模型构建主题模型;四、进行Blo...
- 黄瑞章许伟佳秦永彬陈艳平
- 一种自适应结构学习的深度文本聚类方法及装置
- 本发明公开了一种基于自适应结构学习的深度文本聚类方法,所述方法包括如下步骤:步骤一:构造K‑近邻图;步骤二:通过自适应阈值策略生成自适应结构的图;步骤三:使用阈值衰减策略让图卷积核动态调整拓扑范围,从而学习到文本的自适应...
- 任丽娜黄瑞章潘伟
- DCsR:一种面向中文文本的集成式纠错框架
- 2023年
- 中文文本纠错技术在自然语言处理中有着非常重要的应用。针对书写灵活多变的中文文本,现有的纠错模型无法覆盖多种错误类型且存在从候选集合TOPK中挑选TOP1时出错概率极大的问题。提出了一种面向中文文本的集成式纠错框架——DCsR,摒弃以往建立在已知错误类型的假设上利用单一模型进行纠错的解决方案,根据不同场景选择添加多种表现优异的纠错模型分别进行纠错再集成召回更全面的候选集,同时根据自定义特征的重要程度建立了一个多策略、可拓展的候选排序算法,以挑选更具有公信力的修正结果。DCsR框架有效地解决了模型的偏向性问题,进一步全面提升了对中文文本拼写纠错的能力。实验结果表明,在公开数据集SIGHAN15上,对比现在的主流纠错模型,使用DCsR框架进行纠错的F1值比表现最优的单模型纠错高出了3.93%,进一步提升了对中文文本的纠错能力。针对CGED2020进行的消融实验也表明了DCsR框架的有效性。
- 曹军航黄瑞章黄瑞章赵建辉
- 一种基于神经网络的谓语中心词识别方法
- 本发明公开了一种基于神经网络的谓语中心词识别方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量对文本进行向量映射;步骤二:通过神经网络模型获取句子的特征及长期依赖关系;步骤三:使用Highway网络缓解深度...
- 黄瑞章靳文繁秦永彬陈艳平钟新洋
- 文献传递
- 面向中文关系抽取的句子结构获取方法被引量:1
- 2021年
- 在关系抽取中,神经网络模型是目前最常用的技术之一,然而现有神经网络模型很少考虑句子中两个实体之间的结构特征。该文针对关系抽取任务的特点,提出了基于神经网络模型的句子结构获取方法。该方法通过对关系实例中两个实体的位置进行特殊标记,使神经网络模型能够有效捕获句子中关于实体的结构信息。为了验证方法的有效性,分别采用两种主流的神经网络模型进行对比实验,实验结果表明,该方法在ACE 2005中文关系抽取数据集上的抽取性能得到显著提升,超出对比工作约11个百分点,表明该方法能有效提升关系抽取任务的性能。
- 杨卫哲秦永彬黄瑞章王凯程华龄唐瑞雪程欣宇陈艳平
- 关键词:关系抽取结构特征自然语言处理
- 一种基于卷积神经网络的分段池化关系抽取方法
- 本发明公开了一种基于卷积神经网络的分段池化关系抽取方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量以及零向量对文本进行向量映射;步骤二:通过神经网络对向量矩阵进行卷积操作提取特征;步骤3:对卷积后的结果分...
- 黄瑞章杨卫哲王凯秦永彬陈艳平
- 一种融合时序行为链与事件类型的类案检索方法
- 一种融合时序行为链与事件类型的类案检索方法,属于信息检索领域,包括:采用句法依存分析从案例事实中提取行为要素构造时序行为链;使用BERT‑CRF采取序列标注方法识别法律事件类型,提取案例事实中的犯罪类型;通过神经网络分别...
- 黄瑞章 詹力林 陈艳平秦永彬林川
- 基于狄利克雷多项混合模型的长文本辅助短文本的文本聚类方法
- 本发明公开了一种基于狄利克雷多项混合模型的长文本辅助短文本的文本聚类方法。针对短文本的特征稀疏问题,本发明提出了主题相关长文本辅助短文本的思想,辅助的基础是长文本与短文本共享相同的主题‑词语分配。为了更好地提升聚类效果,...
- 黄瑞章闫盈盈马灿徐立洋丁志远王瑞黄庭刘博伟
- 文献传递
- 一种基于大模型集成优化的合同审查报告生成方法
- 本发明涉及智能识别模型应用技术领域,特别涉及一种基于大模型集成优化的合同审查报告生成方法,解决现有技术中的缺少通过自动化流程提高合同审查的效率和准确性的方法以对合同文本的深入分析和审查的技术问题,合同分类过程、意图识别过...
- 陈艳平 廖进超秦永彬黄瑞章林川
- 基于Highway-BiLSTM网络的汉语谓语中心词识别研究被引量:4
- 2021年
- 针对汉语谓语中心词识别困难及唯一性的问题,提出了一种基于Highway-BiLSTM网络的深度学习模型。首先,通过多层BiLSTM网络叠加获取句子内部不同粒度抽象语义信息的直接依赖关系;然后,利用Highway网络缓解深层模型出现的梯度消失问题;最后,通过约束层对输出路径进行规划,解决谓语中心词的唯一性问题。实验结果表明,该方法有效提升了谓语中心词识别的性能。
- 黄瑞章靳文繁陈艳平秦永彬秦永彬
- 关键词:唯一性