您的位置: 专家智库 > >

余伟

作品数:3 被引量:1H指数:1
供职机构:安徽工程大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 3篇信息抽取
  • 3篇领域本体
  • 3篇本体
  • 3篇抽取
  • 2篇DEEP_W...
  • 1篇信息提取
  • 1篇用户
  • 1篇用户信息
  • 1篇领域知识
  • 1篇后处理
  • 1篇后处理方法
  • 1篇本体构建
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇DEEP
  • 1篇抽取方法
  • 1篇抽取规则

机构

  • 3篇安徽工程大学

作者

  • 3篇余伟
  • 2篇陶皖
  • 1篇徐京

传媒

  • 1篇长江大学学报...
  • 1篇安徽工程大学...

年份

  • 2篇2016
  • 1篇2015
3 条 记 录,以下是 1-3
排序方式:
一种基于领域本体的Deep Web实体信息提取的后处理方法
2016年
目前大多数的Deep Web信息抽取方法依赖Web页面结构,忽略了页面中包含的语义信息及关系,导致抽取结果不理想.针对此问题,提出一种基于领域本体的Deep Web实体信息后处理方法.首先,根据DOM树节点相似性原理和VSM(Vector Space Model)的余弦值方法确定数据区域和实体区域;然后,依据数据区域和实体区域的概念和实例构建领域本体,在领域本体的指导下对实体进行语义标注,将量化的标注结果添加到实体与本体的相似度计算中;最后,提出基于领域本体的实体信息抽取算法,获得实体中与本体相似度最大的子树.选取天气、图书、购物网站数据进行测试,实验结果表明,与已有方法相比,所提方法的F值提高了3.6%~4.9%.该方法不仅能减少抽取信息时对Web页面结构的依赖,而且能充分利用页面中的语义信息和关系,使得抽取结果更精确.
余伟陶皖
关键词:DEEP信息抽取领域本体后处理
基于领域知识的Web信息抽取方法研究
在互联网高速发展的背景下,Web已经成为全球信息化的主要来源,拥有海量数据并且在不断增长。但是,由于Web页面的动态性、内容的多样性和结构的复杂性,使得人们从Web上获得想要的信息很困难。Web信息抽取技术的产生可以将页...
余伟
关键词:领域本体本体构建WEB信息抽取
基于领域本体的微博用户信息抽取方法被引量:1
2015年
传统基于本体的Web页面信息抽取以单个信息项为最小抽取单位,抽取出的实体语义关联性较差和抽取准确率不理想。针对上述问题,以微博领域本体为基础,提出了一种两层次匹配的用户信息抽取方法:将微博中具有语义关联的不同层次的用户信息划分成对应信息块,以信息块作为最小抽取单位分别抽取其中包含的用户各属性信息(包含个人信息、关注的好友信息和所发文本微博信息)。试验结果证明,与传统信息抽取方法相比,设计的抽取规则算法能够有效地提高信息的准确率和召回率,对微博页面结构复杂以及信息量大的Web网页有良好的抽取效果。
余伟陶皖徐京刘成满
关键词:领域本体信息抽取抽取规则
共1页<1>
聚类工具0