李逸薇
- 作品数:12 被引量:74H指数:5
- 供职机构:香港理工大学更多>>
- 发文基金:国家自然科学基金香港特区政府研究资助局资助项目更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 面向问答文本的属性级情感分类研究被引量:2
- 2019年
- 传统情感分析任务的目的是分析整个文本的情感极性,这是一种粗粒度的任务。近年来,随着技术的革新,情感分析任务也在不断细化,研究者们希望能获取关于文本中具体对象的情感极性。文中的研究任务是获取问答文本中关于产品属性的情感极性。针对问答文本的属性级情感分析问题,提出了一种基于注意力机制的方法。首先,将属性信息拼接到答案词向量上;其次,对答案文本和问题文本学习一个LSTM模型;然后,通过注意力机制获得问题文本和答案文本的相关性,并根据相关性的重要程度获取答案文本的整体特征;最后,通过分类器输出最终的整体特征结果。实验结果表明,所提方法优于传统的属性级情感分析方法。
- 江明奇李逸薇刘欢李寿山
- 关键词:情感分析
- 基于双语信息和标签传播算法的中文情感词典构建方法被引量:35
- 2013年
- 文本情感分析是目前自然语言处理领域的一个热点研究问题,具有广泛的实用价值和理论研究意义。情感词典构建则是文本情感分析的一项基础任务,即将词语按照情感倾向分为褒义、中性或者贬义。然而,中文情感词典构建存在两个主要问题:1)许多情感词存在多义、歧义的现象,即一个词语在不同语境中它的语义倾向也不尽相同,这给词语的情感计算带来困难;2)由国内外相关研究现状可知,中文情感字典建设的可用资源相对较少。考虑到英文情感分析研究中存在大量语料和词典,该文借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。在四个领域的实验结果显示我们的方法能获得一个分类精度高、覆盖领域语境的中文情感词典。
- 李寿山李逸薇黄居仁苏艳
- 关键词:情感分析
- 基于情绪相关事件上下文的隐含情绪分类方法研究被引量:4
- 2013年
- 情绪分类是情绪分析研究中的一个基本任务,旨在对文本表达的情绪进行分类。目前,该任务是自然语言处理研究中的一个热点问题。已有的研究一般借助于情绪关键词(例如,"高兴","伤心")来进行情绪分类。然而,在实际中,存在大量的没有情绪关键词但表达情绪的文本,我们称这类情绪表达为隐含情绪表达。该文关注隐含情绪分类方法研究,提出了基于情绪关联事件的隐含情绪分类方法,我们认为情绪的关联事件可以用于对情绪类别进行分类。具体实现中,我们首先采用情绪关键词获得句子群;然后,去除情绪关键词,将上下文作为关联事件表达文本;最后,利用上下文进行情绪分类。实验结果表明,以上下文进行的情绪分类结果达到了一定的性能,远远好于随机分类结果。这一结果为进一步隐含情绪分类提供了良好的基础。
- 李寿山李逸薇刘欢欢黄居仁
- 知识的系统与知识系统的建构:知识本体语言科学整合研究被引量:6
- 2013年
- 语意网络被形容为互联网的下一代,而它所需要的关键技术正是知识本体。本文概述知识本体的发展及其在语言处理中所扮演的重要角色,介绍知识本体和语言科学的跨学科研究,重点讨论知识本体如何解决中文语言处理在语意网络中所面临的挑战。本文还介绍了作者编审的"知识本体"专题中10篇论文的主要内容。
- 黄居仁李逸薇
- 关键词:知识本体
- 基于联合学习的问答情感分类方法被引量:2
- 2019年
- 面向问答型评论的情感分类在情感分析领域是一项新颖且极具挑战性的研究任务。由于问答型评论情感分类标注数据非常匮乏,基于监督学习的情感分类方法的性能有一定限制。为了解决上述困境,该文提出了一种基于联合学习的问答情感分类方法。该方法通过大量自然标注普通评论辅助问答情感分类任务,将问答情感分类作为主任务,将普通评论情感分类作为辅助任务。具体而言,首先通过主任务模型单独学习问答型评论的情感信息;其次,使用问答型评论和普通评论共同训练辅助任务模型,以获取问答型评论的辅助情感信息;最后通过联合学习同时学习和更新主任务模型及辅助任务模型的参数。实验结果表明,基于联合学习的问答情感分类方法能较好融合问答型评论和普通评论的情感信息,大幅提升问答情感分类任务的性能。
- 安明慧沈忱林李寿山李逸薇
- 关键词:情感分类
- 中文情绪识别方法研究被引量:5
- 2013年
- 以中文情绪语料库(Ren-CECps)为基础,重点研究了句子级情绪识别方法.比较了不同特征以及不同机器学习分类方法(NB,SVM,ME)对情绪识别的影响.此外,针对情绪文本和非情绪文本在语料中的分布非常不平衡问题,通过集成学习的算法来实现不平衡情绪识别,用以提高情绪识别的整体性能.实验结果表明:使用基于样本的集成学习方法能够有效解决不平衡问题,明显提高情绪识别的分类性能.
- 刘欢欢李寿山周国栋李逸薇
- 关键词:情绪识别
- 基于序列标注模型的情绪原因识别方法被引量:9
- 2013年
- 情绪原因识别是情绪分析中的一个重要研究任务。该任务旨在自动分析出导致某一情绪发生的原因描述。该文将情绪原因识别任务建模为序列标注模型,即将情绪词相关的子句当成序列,进而整体标注出哪些属于原因子句。具体实现中,我们使用条件随机场(CRF)模型进行求解,并结合了基本词特征、词性特征、距离特征、上下文特征及语言学特征等多种特征进行原因识别。实验结果表明,所采用的这些特征对于原因识别都有一定帮助,特别是上下文特征。此外,我们发现在使用类似特征集合的情况下,序列标注模型能够获得比分类模型更好的识别效果。
- 李逸薇李寿山黄居仁高伟
- 非监督的汉语感情语料库的构建及分析
- 目前感情计算是个全新的研究问题,该问题首先面临的是缺乏相关的语料库。本文提出一种非监督的方法用以创建大规模的文本语料库。该语料库包括一个感情句子语料库和一个中性(无感情)句子语料库。鉴于非监督的方法的自由及方便性,我们可...
- 陈瑛李逸薇黄居仁
- 关键词:感情
- 文献传递
- 基于多任务学习的正逆向情绪分值回归方法被引量:4
- 2020年
- 提出一种基于多任务学习的情绪分值回归方法。首先,针对每一种情绪分值设计了正向打分和逆向打分;其次,将每一种分值的回归任务分为正向打分回归子任务和逆向打分回归子任务;最后,提出一种多任务学习方法用于主任务(正向打分回归子任务)和辅助任务(逆向打分回归子任务)的共同学习。该方法通过3种不同的共享机制实现中间特征信息共享,从而提升主任务的性能。结果表明,所提出的多任务学习方法能比基准方法获得更好的回归性能。
- 高晓雅李逸薇张璐李寿山
- 关键词:多任务学习
- 含情绪词文本的情绪识别方法研究
- 情绪识别是情绪分析研究中的一项基本任务,旨在对文本表达的情绪类型(例如:高兴、伤心等)进行识别。已有的研究一般借助于文本中包含的情绪关键词或利用构建的情绪词典进行情绪识别和类别判断。然而,我们分析语料发现,文本中情绪词在...
- 李逸薇刘欢欢李寿山黄居仁
- 关键词:情绪识别语言学特征
- 文献传递