彭文忠
- 作品数:5 被引量:11H指数:2
- 供职机构:江西财经大学信息管理学院更多>>
- 发文基金:国家自然科学基金江西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Skip-Gram结构和词嵌入特性的文本主题建模被引量:7
- 2020年
- 常见词嵌入学习可以理解为是在分解词的点互信息值矩阵,主题一致性评价方法也使用了词的点互信息,二者存在紧密的联系,但是现今还缺少深入分析主题一致性评价标准和词嵌入之间联系,并将词嵌入的主题特性应用于主题建模的研究.先分析了主题一致性和常见词嵌入的联系,Softmax函数生成的主题-词项分布的特性;然后提出主题分布式假设,并引入SkipGram结构描述中心词的主题和相邻词之间的关联,从而充分使用词嵌入向量相似、关联特点挖掘文本主题.在3种公开数据集上的实验表明,该模型方法比较现有神经网络结构的主题模型,在主题一致性、主题词的专有性方面都有显著提高;同时模型的主题嵌入向量和主题代表词嵌入向量间具有很强的相似或关联特性.
- 夏家莉曹中华曹中华彭文忠
- 关键词:主题模型
- 基于词嵌入特性聚类的文本主题挖掘
- 2022年
- 数据聚类是常用的无监督学习方法,通过词嵌入聚类能够挖掘文本主题,但现有研究大多数采用常规聚类算法挖掘词嵌入的簇类,缺少基于词嵌入特性设计实现词嵌入聚类的主题挖掘算法.该文从语言模型通过建模词间相关信息来使相关及语义相似词的嵌入表示聚集在一起的特点出发,设计词嵌入聚类算法.该算法首先计算中心词的簇类号,然后使该簇中心嵌入和相邻词嵌入的相似性增强,同时使其与负样本词嵌入远离,学习文本集词嵌入的簇类结构,并将其应用于文本主题挖掘.在3种公开数据集上的实验表明:该算法在一些模型的词嵌入结果上能够挖掘出一致性和多样性更好的主题结果.
- 曹中华黄欣彭文忠刘媛春
- 关键词:聚类语言模型文本主题
- 克服阻塞的用户交互处理策略
- 2016年
- 移动实时交互应用成为一种新的基于移动互联网的应用模式。交互对象常常单方面屏蔽对方,这种屏蔽阻塞了两者直接交互,但是,其中部分可以通过第三方传递达到交互目的。针对此种情况,提出一种交互状态模型,及交互性能评价指标;基于有向连通图给出交互状态的判断策略,通过寻找连通路径找到交互的路径,通过寻找最短路径找到交互的最优路径,并提出基于连通图的交互处理策略IPSCG,力图以最小成本找到最简疏通路径。实验表明,这些策略能显著降低交互成本,提高交互性能,增强用户交互的稳定性。
- 曹重华夏家莉彭文忠毛阿敏陈位斌吴丹
- 关键词:交互模型
- 基于完形填空的方面级情感四元组预测
- 2024年
- 方面情感四元组预测(ASQP)任务旨在从给定的评论语句中提取所有方面词以及相应的方面类别、观点表达和情感极性,有助于全面了解用户对产品或服务不同方面的评价情况.现有情感四元组预测方法主要存在以下局限:(1)判别式模型没有利用prompt捕获情感元素之间的语义关系;(2)生成式模型要么简单地将情感元素类型标签组合形成prompt,缺乏理解标签类型涵义的语境;要么将离散模板作为解码器的输入,而编码器则无法捕获到模板中情感元素之间的语义关系.为了缓解这些问题,本文首先基于完形填空思想研制离散和连续2类prompt,提供理解4个情感元素类型涵义的语境,帮助模型更好地捕获情感元素之间的语义关系;然后,基于设计的prompt,提出C-ASQP框架,包含判别式模型DC-ASQP和生成式模型GC-ASQP.在DC-ASQP中,采用2阶段策略,先预测4个情感元素中2个较为容易的情感元素,再将预测结果嵌入到设计的prompt中,帮助模型理解情感元素类型的涵义,从而有效预测另外2个情感元素.在GC-ASQP中,将设计的prompt作为编码器的输入,借助预训练模型的学习模式,充分利用预训练模型蕴含的知识提升四元组的生成效果.实验结果显示,DC-ASQP模型在4个常用数据集上的F1值相比同类判别式最优模型分别提高4.70%、6.48%、6.97%和2.60%,GC-ASQP模型的F1值比最优基准模型分别提高0.86%、1.67%、0.15%和1.02%,验证了将ASQP建模为完形填空任务的有效性,所设计的2类prompt以及C-ASQP框架是有效的.
- 彭文忠夏家莉万齐智万齐智万本庭刘德喜夏池玉
- 关键词:完形填空
- 多原型词向量与文本主题联合学习模型被引量:4
- 2020年
- 常见的词嵌入向量模型存在每个词只具有一个词向量的问题,词的主题值是重要的多义性条件,可以作为获得多原型词向量的附加信息。在skip-gram(cbow)模型和文本主题结构基础上,该文研究了两种改进的多原型词向量方法和基于词与主题的嵌入向量表示的文本生成结构。该模型通过联合训练,能同时获得文本主题、词和主题的嵌入向量,实现了使用词的主题信息获得多原型词向量,和使用词和主题的嵌入式向量学习文本主题。实验表明,该文提出的方法不仅能够获得具有上下文语义的多原型词向量,也可以获得关联性更强的文本主题。
- 曹中华曹中华夏家莉彭文忠
- 关键词:多义词主题模型神经网络