唐焕玲 作品数:43 被引量:139 H指数:6 供职机构: 山东工商学院计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于投票信息熵的AdaBoost改进算法 被引量:5 2010年 针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,还需考虑前几轮的多个基分类器对它的投票分歧.基分类器的信任度不但与错误率有关,还与基分类器间的差异性有关.这样可以提高基分类器的正确性,增加基分类器的差异性.实验结果表明,改进的BoostVE-NB算法能有效地提升NB文本分类性能. 唐焕玲 鲁明羽 邬俊关键词:ADABOOST 朴素贝叶斯 文本分类 面向小样本关系抽取的自适应胶囊网络 被引量:1 2022年 小样本关系抽取任务是自然语言处理中的热点问题,旨在使用低成本的标注数据训练关系抽取模型。目前广泛使用的原型网络存在类原型表达不准确、不完整等问题。为了克服该问题,提出一种自适应胶囊网络(adaptive capsule network,ACNet),ACNet借助胶囊网络的归纳能力生成类原型,并在此基础上对动态路由过程进行评估,使其面对不同样本能自适应调整网络参数。同时,在ACNet中引入一种记忆迭代机制,帮助模型快速确定类表示。在小样本关系数据集FewRel上进行实验验证得出,ACNet能够有效处理小样本关系抽取任务。 张晓明 窦全胜 陈淑振 唐焕玲关键词:关系抽取 小样本 自适应 动态路由 一种设备辅助检修方法和系统 本发明提供了分别用于终端和服务器的设备辅助检修方法和系统,其中,用于终端的设备辅助检修方法包括:检测iBeacon标签发出的标签信号,从标签信号提取设备的身份识别ID,其中,iBeacon标签与设备相贴合;将身份识别ID... 宋英杰 张斌 唐焕玲 周翔凤 邢启江文献传递 一种基于动态多层语义感知机的文本分类方法及系统 本发明提供了一种基于动态多层语义感知机的文本分类方法及系统,包括:获取待分类文本;采用动态多层语义感知机模型,得到所述待分类文本所属的类别;其中,动态多层语义感知机模型包括词嵌入层、若干层依次连接的加权特征学习器和动态深... 唐焕玲 刘孝炎 王育林 窦全胜 鲁明羽文本分类系统SECTCS中若干技术问题的探讨 被引量:6 2003年 SECTCS是笔者在深入研究各种文本分类方法的基础上实现的一个中英文文本分类系统。它集成了质心分类、K近邻分类和朴素贝叶斯分类器等多种文本分类方法,在大规模文本分类实验中表现出良好的性能。该文结合以该系统作为测试平台所得到的各种实验结果,对系统中涉及的若干重要技术问题进行探讨和分析,力图得到一些有价值的结论,希望能够对相关研究工作提供可借鉴的依据。 唐焕玲 付克明 鲁明羽关键词:文本分类 VSM KNN BAYES分类器 一种基于有监督主题模型的文本分类方法及系统 本公开提供了一种基于有监督主题模型的文本分类方法及系统。其中,一种基于有监督主题模型的文本分类方法,包括:构建SLDA‑TC文本分类模型;在训练SLDA‑TC文本分类模型的过程中,按照SLDA‑TC‑Gibbs算法对每个... 唐焕玲 窦全胜 于立萍 宋英杰 鲁眀羽文献传递 融合词信息嵌入的注意力自适应命名实体识别 被引量:3 2023年 缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响,并增强了实体特征的显著性,使实体特征更容易被学习器获取;同时,在注意力机制中引入动态缩放因子,自适应地调整相关实体和无关词的注意力分布,一定程度上减小了无关词对模型的干扰。将该方法在公共数据集上进行实验,实验结果证明了方法的有效性。 赵萍 窦全胜 窦全胜 唐焕玲 陈淑振关键词:中文命名实体识别 未登录词 程序合成虚拟机 本发明公开了一种程序合成虚拟机的逻辑设计方案,具体包括程序存储器、参数存储器、控制器、模型接口等程序合成虚拟机所涉及的重要部件的设计;同时给出了一种基于程序合成虚拟机的程序自动合成的解决方案。以解决目前程序自动合成过程中... 窦全胜 唐焕玲 姜平文献传递 Tr-SLDA:一种面向交叉领域的迁移主题模型 被引量:1 2021年 当目标领域缺少足够多的标注数据时,迁移学习利用相关源领域的标注数据,辅助提升目标域的学习性能,但是目标域与源域的数据通常不满足独立同分布,容易导致“负迁移”问题.本文在有监督主题模型(Supervised LDA,SLDA)的基础上,融合迁移学习方法提出一种共享主题知识的迁移主题模型(Transfer SLDA,Tr-SLDA),提出Tr-SLDA-Gibbs主题采样新方法,在类别标签的约束下对不同领域文档中的词采取不同的采样策略,且无需指定主题个数.辅助源域与目标域共享潜在主题空间,Tr-SLDA通过发现潜在共享主题与不同领域类别之间的语义关联从源域迁移知识,可以有效解决“负迁移”问题.基于Tr-SLDA迁移主题模型提出Tr-SLDA-TC(Tr-SLDA Text Categorization)文本分类方法.对比实验表明,该方法可有效利用源域知识来提高目标领域的分类性能. 唐焕玲 郑涵 刘艳红 马思源 窦全胜 窦全胜关键词:文本分类 主题模型 负迁移 基于半监督与集成学习的文本分类方法研究 1.半监督学习中的Co-training算法,通常假设两个特征视图具备一致性和独立性的要求,然而实际应用中同时满足上述条件且自然划分的视图往往不存在,且二者的独立性很难直接评判。本文提出了结合TEF-WA技术的Co-tr... 唐焕玲关键词:半监督学习 文本分类 文献传递