中央高校基本科研业务费专项资金(10CX01003A)
- 作品数:2 被引量:5H指数:2
- 相关作者:李华昱欧阳纯萍徐九韵刘亚南更多>>
- 相关机构:中国石油大学(华东)北京科技大学更多>>
- 发文基金:中央高校基本科研业务费专项资金教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于领域本体和关系模型的XML语义集成方法被引量:3
- 2011年
- 由于缺乏足够的语义信息,不同模式的XML数据之间很难进行互操作。针对油气井工程中的XML数据集成需求,借助领域全局本体,提出一种模式无关的XML语义集成方法。该方法首先在XML Path路径与领域本体之间进行语义映射,屏蔽其模式差异;然后,按照模型映射方法将XML存储为关系数据;最后通过查询重写将SPARQL转换为SQL语句,实现语义查询。该方法对XML模式进行语义标注,利用关系数据库存储与查询XML数据,能有效处理领域XML数据的语义集成。
- 李华昱欧阳纯萍徐九韵
- 关键词:领域本体XML模式语义映射语义查询
- 一种χ2统计-遗传算法的特征提取技术研究被引量:2
- 2012年
- 特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优解的产生。针对特征提取技术中的问题,提出基于χ2统计-遗传算法的特征提取算法,此方法将词条的χ2统计值引入到特征向量中,将此类向量作为遗传算法的初始种群进行启发式搜索,与此同时,针对特征提取的性质,提出新的适应度函数和交叉规则。实验表明,基于χ2统计-遗传算法的特征提取算法能选择出准确表征文本类别的特征项,将其运用到文本分类系统中能有效地提高文本分类的准确率。
- 李华昱刘亚南欧阳纯萍
- 关键词:文本分类特征提取遗传算法