陆勤
- 作品数:10 被引量:86H指数:4
- 供职机构:香港理工大学更多>>
- 发文基金:国家自然科学基金深圳市基础研究计划项目广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术哲学宗教语言文字理学更多>>
- “自下而上”与“自上而下”本体构建方法的探讨被引量:5
- 2013年
- 本体构建旨在对知识体系的概念和关系建模并形成体系化的知识,从而辅助计算机进行智能化的处理。上位本体包含的概念是与领域无关的通用概念集,而多数通过算法自动提取而获得的本体主要用于特定领域的概念知识。本文首先介绍在本体构建中领域核心本体(也称中位本体)和应用(也称下位本体)之间的关系。然后以计算机领域为例,阐述一个如何利用英文的上位本体SUMO通过"自上而下"的方法建立的中位本体。基于下位本体的特性,本文进而介绍一种"自下而上"的本体构建方法。
- 陆勤谌贻荣李素建
- 结合卷积神经网络和词语情感序列特征的中文情感分析被引量:49
- 2015年
- 目前基于词嵌入的卷积神经网络文本分类方法已经在情感分析研究中取得了很好的效果。此类方法主要使用基于上下文的词嵌入特征,但在词嵌入过程中通常并未考虑词语本身的情感极性,同时此类方法往往缺乏对大量人工构建情感词典等资源的有效利用。针对这些问题,该文提出了一种结合情感词典和卷积神经网络的情感分类方法,利用情感词典中的词条对文本中的词语进行抽象表示,在此基础上利用卷积神经网络提取抽象词语的序列特征,并用于情感极性分类。该文提出的相关方法在中文倾向性分析评测COAE2014数据集上取得了比目前主流的卷积神经网络以及朴素贝叶斯支持向量机更好的性能。
- 陈钊徐睿峰桂林陆勤
- 关键词:卷积神经网络情感分析
- 基于语料库的明清小说人名与称谓研究被引量:4
- 2015年
- 在自然语言处理及其应用领域,人名和称谓作为重要的命名实体,是信息处理的关键部分之一。该文从命名实体识别和资讯提取的角度出发,在对4部明清古典小说的语料库进行标注的前提下,建构了姓名、字号和称谓作为命名实体的分类及标注系统。人名和称谓总体上分为单一型和复合型,根据复合型的内部组成元素和组合方式,将其进一步分为固定式、同位式、附属嵌套式、灵活嵌套式。结合语料库的完整数据统计,该文对各类型人名和称谓进行了比较分析,并分别展示了4部名著在人名、称谓使用上的特点。
- 熊丹陆勤罗凤珠石定栩赵天成
- 关键词:语料库构建
- 接受还是拒绝? 反应模式助推基础课与拓展课均衡选择被引量:2
- 2019年
- 近年课外辅导成为学生学习生活的重要部分,人们普遍选择拓展课数较多,选择基础课数较少。为了实现基础课及拓展课学习的均衡发展,本研究在"接受或拒绝反应模式"(Shafir, 1993)的理论框架指导下,通过3个实验探索反应模式对小学生课外辅导课程类型(基础课/拓展课)选择的影响。实验1探讨来自不同家庭的三代人(小学生/父母/祖辈)在不同反应模式(接受/拒绝)下的课程决策差异。为排除不同家庭环境因素的可能影响,实验2探讨来自同一家庭的三代人在不同反应模式下的课程决策差异。实验3在真实的课外辅导现场报名点检验反应模式助推基础课选择的生态化效度。结果表明,(1)父母组选择的辅导课总数显著多于祖辈组和小学生组;(2)三代人在接受和拒绝反应模式下均偏好选择拓展课;(3)同接受反应模式相比,三代人均在拒绝反应模式下选择更多课程,具体表现在拒绝反应模式下对基础课和拓展课的选择数均相对增加,但对拓展课的选择比例相对减少,对基础课的选择比例相对增加,课程的选择趋于均衡。鉴于此,在选课中简单地采用拒绝反应模式,便可助推小学生家庭选择更多基础课,从而实现基础课及拓展课的均衡选择。本研究成功验证了拒绝反应模式在儿童教育决策领域的适用性,对儿童教育者及学生家庭有重要现实指导意义。
- 刘隽张震孙彦孙彦韩布新刘萍萍
- 关键词:助推课外辅导课程类型
- 面向微博文本的情绪标注语料库构建被引量:17
- 2014年
- 文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点进行分析以及对情绪分析算法性能进行评估,该文在对微博文本情绪表达特点进行深入观察和分析的基础上,设计了一套完整的情绪标注规范。遵循这一规范,首先对微博文本进行了微博级情绪标注,对微博是否包含情绪及有情绪微博所包含的情绪类别进行多标签标注。而后,对微博中的句子进行有无情绪及情绪类别进行标注,并标注了各情绪类别对应的强度。目前,已完成14 000条微博,45 431句子的情绪标注语料库构建。应用该语料库组织了NLP&CC2013中文微博情绪分析评测,有力地促进了微博情绪分析相关研究。
- 姚源林王树伟徐睿峰刘滨桂林陆勤王晓龙
- 关键词:语料库构建
- ISO/IEC 10646国际编码标准下的香港电脑汉字编码及字形原则被引量:1
- 2019年
- 在ISO/IEC 10646国际编码标准中,香港使用的汉字载于H列。该文介绍了如何在ISO/IEC 10646国际编码标准下进一步完善香港电脑汉字的扩展机制及H列字符字源资料的编码方案。由于目前H列的很多字形并未完全反映香港的实际习惯写法,因此香港制定了一套适用于香港常用写法的电脑汉字参考字形,该文介绍了此套字形的原则。
- 熊丹陆勤
- 关键词:字形字符集
- 中文核心领域本体构建的一种改进方法被引量:5
- 2010年
- 核心本体对最基本的领域知识建模,并在上位本体和领域本体之间建立联系。上位本体是领域无关的而核心本体是领域相关的,因此在自动创建中文核心本体过程中,映射中文核心术语到上位本体概念有很多的错误。本文提出的改进方法首先找到共享后缀术语集内被共享的术语条数更多、与各术语的意义更接近的上位概念;然后用其来改进词集中的核心术语和概念之间的映射。实验证明,该方法有效的提高了核心本体自动创建的精确度。
- 谌贻荣陆勤李文捷崔高颖
- 关键词:计算机应用中文信息处理本体构建领域本体
- 一种基于共享后缀术语集改进中文核心领域本体构建的方法
- 核心本体对最基本的领域知识建模并在上位本体和领域本体之间建立联系。上位本体是领域无关的而核心本体是领域相关的,因此在自动创建中文核心本体过程中,映射中文核心术语到上位本体概念有很多的错误。本文以一个基于术语词集抽取共享后...
- 谌贻荣陆勤李文捷崔高颖
- 关键词:领域本体
- 文献传递
- 2061个四字情感词库:基于青年人和老年人的评价
- 情感词不仅可用于探讨词汇识别、注意、记忆、情绪等的认知神经机制,还可用于自然语言处理、情绪识别、人工智能等。情绪词的标准化有利于比较不同实验室的情绪研究成果,进行重复研究。目前汉语情绪词库主要有王一牛和罗跃嘉(2008,...
- 刘萍萍张震陆勤韩布新
- 关键词:汉语词汇年龄差异
- 文献传递
- 利用遗传算法实现词类标记集的优化被引量:3
- 2001年
- 过去词类标记集的选择主要基于专家的经验知识 ,缺乏自动或半自动的方法来辅助这一过程。本文提出了一种利用遗传算法来搜索优化的标记集的新方法。这种方法可以在一个候选标记集集合中自动搜索一个最优或较优的标记集 ,并可根据应用的需求调整参数以适应特定任务的需求。实验表明
- 孙宏林陆勤俞士汶
- 关键词:词性标注遗传算法评价函数词汇分类