朱倩
- 作品数:20 被引量:63H指数:4
- 供职机构:江苏大学计算机科学与通信工程学院更多>>
- 发文基金:国家自然科学基金江苏省普通高校研究生科研创新计划项目江苏省科技攻关计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 拟人视觉系统的显著性检测方法被引量:2
- 2016年
- 从人眼的视觉机制出发,提出了一种拟人视觉系统的显著性检测方法。该方法首先对图像进行量化并选取出高频颜色,降低了计算的复杂度,然后对图像进行分割对比,初始的视觉点以图像的中心作为基准点,通过提出的视觉引力模型迭代计算出视觉点的移动轨迹,最终寻找到显著区域。在公开的数据集上的实验结果表明,本方法所寻找到的显著区域相对于其他方法能够更精确地对显著区域进行标注,更加符合实际应用。
- 张文康朱倩陈潇君
- 关键词:显著性检测
- 基于描述逻辑的中文信息抽取研究
- 描述逻辑提供了知识的形式化表示,并有清晰的模型-理论机制和强大的推理功能,是一阶逻辑的一个可判定子集。本文首先综述了信息抽取的研究现状和中文信息抽取的特点。然后根据描述逻辑语义解释特征,提出了基于描述逻辑的中文信息抽取体...
- 朱倩程显毅
- 关键词:信息抽取描述逻辑中文
- 多核集成支持向量机合成孔径雷达目标分类
- 2022年
- 雷达数据的复杂性增加了合成孔径雷达(SAR)目标分类和识别的难度。传统的多核分类方法先在单个再生核希尔伯特空间(RKHS)中学习基核的线性组合,再通过学习相关参数对SAR目标进行分类。由于传统方法忽略了多核中的最佳参数选择以及多核之间的结构特征,因此会导致识别结果出现偏差。鉴于此,提出了一种多核集成支持向量机SAR目标分类方法,通过设计一个集成损失函数将多个单独的核分类损失进行集成,从而将多个单独的核分类模型统一成一个整体,并共同优化和学习多个单独模型的最优参数。试验结果表明,该方法与SimpleMKL和SpicyM⁃KL等方法相比,在移动与静止目标搜索与识别(MSTAR)计划的多类别SAR数据集上的分类识别准确率可提升0.5%~10%。
- 周一鸣吴玉仁沈项军朱倩吴蔚张江涛
- 关键词:合成孔径雷达多核学习
- 基于属性选择的半监督短文本分类算法被引量:8
- 2010年
- 针对海量短文本分类中的标注语料匮乏问题,提出了一种基于属性选择的半监督短文本分类算法。通过基于ReliefF评估和独立性度量的属性选择技术选出部分具有较好的属性独立关系的属性参与分类模型的学习,以弱化朴素贝叶斯模型的强独立性假设条件;借助集成学习,以具有一定差异性的分类器组去估计初始值,并以多数投票策略去分类未标注语料集,以减低最大期望算法(EM)对于初始值的敏感。通过真实语料上进行的比较实验,证明了该方法能有效利用大量未标注语料提高算法的泛化能力。
- 蔡月红朱倩孙萍程显毅
- 关键词:半监督学习文本分类
- 人称名词短语单复数信息和最大熵模型的指代消解被引量:1
- 2009年
- 针对中文人称名词短语单复数属性信息不明确,对消解贡献低的问题,利用改进的最大熵模型提出了人称代词消解新的模型。该模型在原有特征的基础上增加了人称名词短语单复数识别的Head特征、Qun特征和Len特征。在真实文本环境下与不使用单复数属性信息方法进行了对比实验,结果表明该方法的F值与不使用单复数属性信息方法的F相比有一定的提高。
- 钟丹朱倩李梅程显毅
- 关键词:最大熵指代消解
- 基于句义三维模型的汉语句子相似度计算
- 2009年
- 通过对句子语义表示的深入分析,提出汉语句义的三维表示模型,并在此基础上提出一种基于句义三维表示模型的句子相似度计算方法。该方法从义面、义原、义境三个侧面来综合描述句子的语义,并通过迭代求解各方的权重,从而使计算结果达到最优。与传统的方法相比,更加全面、准确地衡量句子之间的相似度,取得了较好的实验结果。
- 蔡月红朱倩程显毅杨天明
- 关键词:句子相似度
- 面向事件的多文档文摘生成算法的研究被引量:1
- 2011年
- 针对目前基于主题相似性生成多文档文摘的系统存在语义不精确、只能传达多篇具有同一主题的文档所携带的主要信息(横向文摘)的问题。本文基于HNC理论,提出的面向事件的多文档自动文摘模型,旨在用很短的文本来传达多篇具有同一事件的文档所携带的后续报道信息(纵向文摘)。实验结果表明,本方法在信息覆盖率、信息冗余度和文摘流利度方面比TF×IDF方法有很大的改进。
- 程显毅潘燕朱倩孙萍
- 关键词:多文档文摘HNC自然语言处理
- 未定义类型的关系抽取的半监督学习框架研究被引量:7
- 2012年
- 设计未定义类型关系抽取系统是目前研究的热点.但在没有特定领域的、机器可读的知识作为指导的情况下,面向自然语言文本的关系抽取很难取得令人满意的精确度和召回率,约束可以有效辅助语义关系的抽取.本文描述了一个提取"实体-属性-值"关系的半监督的机器学习框架,在半监督学习任务中,种子主要从维基百科的信息表格中获取,首先用线性分类器找出一些强反例,然后迭代的使用已有的反例数据重新训练分类器再应用到余下的未标注数据上找出更多反例.经过半监督学习得到了一个关系候选实例集,接下来讨论了关系类别验证问题,对于噪声模式,给出关系模式置信度评价指标,对于冲突模式提出了控制匹配顺序(高置信度模式优先匹配的原则)算法.经过这两个算法后,关系类别的描述仍具一定的多样性,提出凝聚型层次聚类算法,该算法将维基百科描述的结构特征表示为向量{DW,CW,IW,BW},进而给出两个关系模式相关度计算模式,完成关系类别聚类.最后,在WikipediaXML数据集进行了相关的实验,结果表明:根据维基百科的结构特征,动态的确定关系类别,减少了对预定义类型的依赖,提高了关系识别系统的可移植性.
- 程显毅朱倩
- 关键词:关系抽取半监督学习维基百科
- 基于Tri-training半监督学习的中文组织机构名识别被引量:4
- 2010年
- 针对中文组织机构名识别中的标注语料匮乏问题,提出了一种基于协同训练机制的组织机构名识别方法。该算法利用Tri-training学习方式将基于条件随机场的分类器、基于支持向量机的分类器和基于记忆学习方法的分类器组合成一个分类体系,并依据最优效用选择策略进行新加入样本的选择。在大规模真实语料上与co-training方法进行了比较实验,实验结果表明,此方法能有效利用大量未标注语料提高算法的泛化能力。
- 蔡月红朱倩程显毅
- 关键词:半监督学习
- 基于agent的模式表示模型AIM被引量:2
- 2010年
- 针对模式表示研究存在的语义缺失问题,基于agent技术和人的记忆原理,提出一个新的模式表示模型agent影响图(agent influence map,AIM)。AIM反映了模式的整体特征,提供一个有效的软计算工具来支持基于先验知识的自适应行为。AIM通过特征的多阶段整合呈现记忆模式的层次性;把模式信息存储在整个网络中,通过协作涌现出高层次特征体现记忆的语义特性。
- 程显毅朱倩管致紧
- 关键词:智能体