您的位置: 专家智库 > >

国家自然科学基金(60373095)

作品数:29 被引量:388H指数:13
相关作者:林鸿飞杨志豪赵晶黄德根叶正更多>>
相关机构:大连理工大学朝阳师范高等专科学校吉林市教育局更多>>
发文基金:国家自然科学基金国家高技术研究发展计划教育部科学技术研究重点项目更多>>
相关领域:自动化与计算机技术文化科学医药卫生理学更多>>

文献类型

  • 39篇会议论文
  • 29篇期刊文章

领域

  • 59篇自动化与计算...
  • 4篇文化科学
  • 3篇语言文字
  • 2篇经济管理
  • 2篇医药卫生
  • 1篇哲学宗教
  • 1篇生物学
  • 1篇化学工程
  • 1篇理学

主题

  • 13篇向量
  • 11篇中文
  • 9篇抽取
  • 7篇生物医学
  • 7篇向量机
  • 6篇向量空间
  • 6篇向量空间模型
  • 5篇文本
  • 5篇文本分类
  • 5篇相似度
  • 5篇关系抽取
  • 4篇信息处理
  • 4篇语言处理
  • 4篇语义
  • 4篇支持向量
  • 4篇支持向量机
  • 4篇生物医学文献
  • 4篇中文信息
  • 4篇中文信息处理
  • 4篇自然语言

机构

  • 68篇大连理工大学
  • 2篇北京大学
  • 2篇朝阳师范高等...
  • 1篇吉林市教育局

作者

  • 52篇林鸿飞
  • 22篇杨志豪
  • 10篇赵晶
  • 6篇黄德根
  • 4篇叶正
  • 4篇苏绥
  • 3篇时达明
  • 3篇刘菁菁
  • 3篇倪茂树
  • 3篇徐琳宏
  • 3篇何莉
  • 3篇宋锐
  • 2篇付建文
  • 2篇丁堃
  • 2篇孙晓
  • 2篇孟军
  • 2篇宋丹
  • 2篇许侃
  • 2篇潘红艳
  • 2篇卢冶

传媒

  • 8篇计算机工程与...
  • 6篇第三届学生计...
  • 5篇小型微型计算...
  • 3篇情报学报
  • 3篇中文信息学报
  • 2篇计算机研究与...
  • 2篇计算机工程
  • 2篇计算机应用与...
  • 2篇大连理工大学...
  • 2篇第十届全国计...
  • 2篇全国第八届计...
  • 1篇控制与决策
  • 1篇智能系统学报
  • 1篇2009年全...
  • 1篇大连理工大学...

年份

  • 11篇2009
  • 8篇2008
  • 19篇2007
  • 19篇2006
  • 10篇2005
  • 1篇2004
29 条 记 录,以下是 1-10
排序方式:
基于奇异值分解的蛋白质关系抽取
随着生物医学的迅速发展,从医学文献中抽取蛋白质关系已经成为面向生物医学方面的自然语言处理任务中一项非常重要的任务。目前研究学者已经提出很多蛋白质关系抽取的方法,但是其中大部分方法都要依赖于句法分析工具获得句法信息,语义信...
张霄林鸿飞杨志豪
关键词:蛋白质关系抽取奇异值分解
文献传递
基于支持向量机的人物属性抽取被引量:13
2007年
研究了如何使用机器学习方法和语义资源实现有效的人物属性抽取.人物属性抽取是指从自由文本中提取出人的属性信息,如性别、职务信息等.如果把描述人属性的词也看做是实体,则可以把人物属性抽取看作是实体关系抽取的具体应用.使用<知网>提取描述人属性的词作为触发词,这样就可以把触发词和人名间的描述关系转化为一分类问题.当选取触发词和人名左、中、右的3个词的词义和词性作为特征,使用支持向量机进行判别时达到最好抽取效果.
叶正林鸿飞苏绥刘菁菁
关键词:属性抽取支持向量机
基于模板抽取和丰富特征的药名词典生成
近年来,关于药的作用及其对人类健康影响的研究越来越多,相关的文献也迅速增长,工业界认为90%的药物标靶来自于生物医学文献,随之基于药的相关检索逐渐成为焦点。而为相关专家提高检索效率、方便获得资料的第一步就是要准确的识别出...
徐博林鸿飞杨志豪
关键词:命名实体识别去噪
文献传递
基于网页框架和规则的网页噪音去除方法被引量:24
2007年
提出了一种基于网页框架和规则的网页去除噪音的新方法,该方法根据网页中HTML标签将网页分成若干部分,对各个table的长宽比属性进行比较,去掉长宽比很大的部分,并对其余table中的内容进行分析,根据内部是否存在和段落文字有关的标签


等来区分主题内容和噪音内容,在此基础上去除噪音内容。对来自CWT200G语料的132 559个网页进行测试后的结果表明,该方法可以有效地去除网页噪音,使索引文件减少约75%,大大地提高了检索速度,准确度也得到一定提高。

时达明林鸿飞杨志豪
关键词:信息检索网页噪音
中文文本体裁的自动分类机制被引量:8
2006年
文本按体裁自动分类属于按文本的形式分类的范畴,所以它与按内容自动分类问题有许多的不同之处,本文提出了一种关于中文文本体裁自动分类的新机制。在体裁分类过程中首要的问题是分类特征的选取,体裁分类特征项分为两种方式加以描述,一是集合形式,如基于分类词典和语料统计的政论性词汇和情感词汇等,二是规则形式,如公文标识信息和条文句等。基于根据特征之间的关联性和差异性,采用样本分布决策的方法抽取相应的特征项。最后利用支撑向量机算法进行自动分类。该机制已经在五类体裁的语料上得到实现,并获得了较好的效果。
方鸷飞林鸿飞杨志豪赵晶
关键词:计算机应用中文信息处理体裁分类支撑向量机
一种应用奇异值分解的RankBoost排序学习方法
Learning to rank(排序学习)已经成为当今信息检索领域研究和讨论热点。它运用信息检索和机器学习领域的方法,结合相关性判断条件提供与查询更加相关的信息。当前的排序算法主要集中于相关性标注数据的使用,本文通过对...
林原林鸿飞苏绥
关键词:信息检索奇异值分解
文献传递
基于N-Level VSM在Web信息检索中的研究被引量:3
2006年
分析了传统向量空间检索模型在Web信息检索中的不足,给出了基于N-Level向量空间模型,这种模型是将一篇文档从逻辑上划分为N个相对独立的文本段,然后按照文本段的内容建立文本特征向量以及文本权值向量,在此基础上可以更加精确地定义特征值向量和相似度的计算方法,使之能比较好地适应文档集合的动态扩充。同时进行了两种模型算法时间的复杂度的比较分析。理论分析和实验结果表明,基于此模型实现的信息检索算法具有较快的查找速度和较高的查准率。
付克志林鸿飞
关键词:向量空间模型查全率查准率时间复杂度
生物医学文献中的蛋白质相互作用关系抽取系统
从生物医学文献中抽取蛋白质(基因)相互作用关系对蛋白质知识网络的建立,蛋白质关系的预测,新药的研制等均具有重要的意义。本文提出了一个生物医学文献中的蛋白质相互作用关系抽取系统。该系统首先使用条件随机域模型对文献进行实体识...
吴宝栋杨志豪林鸿飞
关键词:指代消解关系抽取
文献传递
基于语义框架的话题跟踪方法
话题跟踪属于话题识别与跟踪(TDT)的一项子任务,是一种基于事件的信息组织技术。话题跟踪任务就是根据话题相关的训练新闻报道,在后续报道中发现与这个话题相关的所有报道。针对传统的向量空间模型的不足,文章提出了一种利用语义框...
林鸿飞宋丹杨志豪
关键词:语义框架向量空间模型
文献传递
基于互信息的中文姓名识别方法被引量:28
2004年
提出并实现了一个基于互信息的中文姓名识别方法.该方法充分挖掘姓名和其上下文信息的关联程度以及姓名用字之间关联程度的信息,引入互信息对其进行定量的描述;提出中文姓名的上下文互信息、内部互信息等概念,并对其建立了动态评价函数.开放测试结果表明,该方法有效地提高了中文姓名识别的效果,保证了较高的精确率和召回率.
黄德根马玉霞杨元生
关键词:中文姓名互信息上下文召回识别方法
共7页<1234567>