李云静
- 作品数:4 被引量:13H指数:3
- 供职机构:东北石油大学计算机与通信工程学院更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于GATE的油田信息抽取技术研究被引量:4
- 2014年
- 针对目前国内油田信息抽取系统中文信息抽取不准确的现状,提出了更为准确的基于油田的中文信息抽取的解决方案。在GATE框架下,开发中文信息抽取插件,解决了基于油田的中文分词、中文语料词表和中文命名实体识别,并在企业实际中进行了应用,取得了较好的应用效果,并为后续的油田信息抽取技术研究提供了研究基础。
- 文必龙李云静王琪超金宗泽高快
- 关键词:GATE信息抽取命名实体识别
- 基于油田领域本体的信息抽取技术研究被引量:6
- 2015年
- 文中主要针对当前油田搜索引擎本身不能直接、自动、高效地从油田文本中抽取出精确信息,语义信息不清晰,而且模式不明确的现状进行分析、研究,将信息抽取技术引入到油田信息搜索引擎中,从而构建一种适合于油田领域的信息抽取系统。构建油田领域本体,在GATE框架下,对油田信息进行语法分析并生成相应的抽取规则,最后对文档进行信息抽取,展示抽取结果。该研究会为以后油田自动报表生成、知识推理、自动问答等提供依据,具有很大的实用价值。
- 文必龙李云静
- 关键词:信息抽取GATE本体领域本体
- 基于FR算法的数据模型三维可视化研究被引量:1
- 2014年
- 针对传统数据模型描述方式无法满足用户快速理解和使用数据模型的不足,论文提出建立数据模型的三维可视化描述。对于传统FR算法在实体节点过多时将导致图形绘制过慢、连线交叉过多等问题,论文结合数据模型的特点,基于实体结构和实体属性对FR算法进行改进,改进后的FR算法不仅能快速地绘制三维图形,而且可以显示实体节点及实体关联等信息,从而辅助建立三维可视化模型,直观的表达数据模型,梳理数据模型的结构,加快用户对数据模型的理解。
- 文必龙高快刘雪飞金宗泽李云静
- 关键词:数据模型三维可视化图像设计
- 基于语料库和规则库的石油本体自动构建研究被引量:3
- 2015年
- 石油领域文本所蕴含的信息丰富但其数目繁多复杂,现有大多数本体都是通过手工构建的,这种方法难以方便快捷地抽取文本信息,难以构建一个较完善的石油领域本体。为提高本体构建的效率,文中综述了本体的主要概念,分析了本体构建的一般原则和方法。利用文本处理软件对文本进行分词处理,生成特征词集并对其进行缩减,利用Petro-Onto方法实现语料库的构建,提出了基于语料库和规则库区分概念、属性并抽取它们之间关系的方法。该方法能大大提高本体的构建效率,并在一定程度上保证结果本体的质量,达到了本体自动建立的目的。
- 文必龙段炼汪志群李云静王琪超
- 关键词:语料库规则库领域本体