国家自然科学基金(60473125)
- 作品数:51 被引量:188H指数:8
- 相关作者:李国和吴卫江姜芳林仁杰赵磊更多>>
- 相关机构:中国石油大学(北京)中国政法大学中国石油化工股份有限公司更多>>
- 发文基金:国家自然科学基金石油科技中青年创新基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术石油与天然气工程更多>>
- 多种群遗传算法在微震震源定位中的应用被引量:13
- 2015年
- 微震震源的精确和快速定位对坑道安全的预测至关重要;在设定均质均速模型条件下,两两检波器的观测走时和计算走时的拟合差绝对值之和为适应度函数,把微震震源定位转换为求解优化问题;采用格雷码对震源位置进行编码,提高了遗传算法的局部搜索能力;同时采用两个群体独立进化,分别利用轮盘和排序方法从两个群体中选择优秀个体,将各种群中的优秀个体进行交叉运算和变异产生新的个体,从而提高了遗传算法的全局搜索能力;通过实验证实优化后的遗传算法在微震震源定位中具有较高的性能和精度。
- 王泉栋李国和吴卫江洪云峰刘智渊程远
- 关键词:多种群遗传算法格雷码
- 人工神经网络在并行计算机集群上的设计研究被引量:4
- 2010年
- 人工神经网络在集群上的并行化设计和实现能够充分发挥ANN并行处理的特点,缩短训练时间,降低算法复杂度。随着并行技术的日益成熟,在并行集群上以软硬件相结合的方式设计神经网络的重要性也不断提高。从软硬件平台的多方面讨论了并行集群技术对人工神经网络设计的支持,提出了一种SOM神经网络在并行集群上的设计方法和基础框架,并就并行集群上神经网络训练效率的问题进行了深入讨论。该方案可广泛应用于多种神经网络模型的并行计算机实现。
- 郭文生李国和
- 关键词:SOMINFINIBAND集群系统
- 一种基于PCA的文本特征混合选择方法被引量:9
- 2019年
- 由于文本分类中的特征空间高维稀疏,传统单一的降维方法难以满足实际大数据分类需求。针对这种情况,提出一种两阶段的混合特征选择方法。第一阶段计算每个特征词的信息增益率并进行排序,然后根据设定的阈值进行特征词的选择。第二阶段利用主成分分析方法将第一阶段输出的仍保持高维特性的高维特征空间映射到低维新特征空间。实验结果表明,与单一的传统方法比较,混合特征选择方法实现了二次降维,不但减少了计算开销,还提高了分类性能。
- 张扬武张扬武李国和王立梅宗恒
- 关键词:降维文本分类主成分分析信息增益率
- 基于Android手机的标签数字码识别与应用
- 2015年
- 为了实现商品的标签中印刷体数字码Android手机实时拍摄与识别,对手机拍摄图像进行灰度化、二值化、标签分离和定位预处理;进一步采用数字区域定位、数字分割和归一化处理后进行数字统计特征提取,通过特征相似性计算识别与矫正,实现高精度的数字码识别;由C语言实现图像处理功能,并形成动态链接库;采用Java,基于NDK调用动态链接库,形成具有交互功能的Android手机实时拍摄数字标签的识别系统;实验结果表明,Android手机实时拍摄与识别具有识别率高、稳定性好、操作简单的特点。
- 林仁杰李国和成一功吴卫江洪云峰
- 关键词:图像处理ANDROID手机
- 基于属性相似度的连续型特征选择方法被引量:2
- 2014年
- 特征选择作为模式识别领域的研究热点,是一种重要的降维方法.对于连续型特征,目前主要采用离散化方法或特征分类能力的"相关性"评估进行特征选择.引入区间数相似度的概念,提出一种连续型特征选择方法.该方法以区间数相似度为基础,定义每个特征的属性相似度,以此作为特征选择的启发信息,对特征全集进行排序,选择特征子集,实现特征选择.相关实验表明了该方法的有效性.
- 王宏威李国和
- 关键词:区间数属性相似度
- 基于语义的文档特征提取研究方法被引量:10
- 2016年
- 中文文本特征词选取是文本处理的重要方面,对文本分类有重要影响。现有的文本特征提取方法存在生成特征向量维数高、依赖训练集、忽略低频关键词等不足。利用《同义词词林》计算词语之间的语义距离,通过聚类算法筛选类别的主题相关词,最后通过信息增益算法从主题相关词中选取特征词。以宏F值和微F值为评价指标,通过有效性实验和对比实验表明,该方法的文本特征选取效果优于其他经典算法。
- 姜芳李国和岳翔
- 关键词:特征词语义距离信息增益文本分类
- 基于关键词加权的法律文本主题模型研究被引量:1
- 2019年
- 为了降低法律文本中的无关词语对分类的影响和突出法律关键词汇的作用,采用主题模型建立一种基于法律词汇加权的文本分类模型。针对不同类别的法律文本的关键词的不同,在主题模型中提出了按关键词标记词到主题的文本集,并进行权值学习,用权值更新文档到主题的分布,从而提高了文档相似度计算的准确性。通过在Westlaw真实数据集上的计算分析,与传统的主题模型相比,加权的主题模型可以获得较好的困惑度和文本相似度。
- 张扬武张扬武李国和
- 关键词:主题模型法律文本关键词加权
- 基于语义的文档关键词提取方法被引量:10
- 2015年
- 以语义为基础实现文档关键词提取是提高自动提取准确度的有效途径。以中文文档为处理对象,通过《同义词词林》计算词语间语义距离,对词语进行密度聚类,得到主题相关类。
- 姜芳李国和岳翔
- 关键词:语义距离密度聚类关键词提取
- 基于决策树生成及剪枝的数据集优化及其应用被引量:14
- 2018年
- 为提高智能模型的识别精度,增强其泛化能力,需要对用于智能建模的数据集中的对象类别异常进行检测和修正。在进行数据集和决策树形式化描述的基础上,将基尼指数增益率作为确定连续条件属性最优二分原则,采用递归算法生成叶节点中对象为同一类别的二叉决策树。利用信息熵评价决策树剪除叶节点中对象的类别分布效果,实现数据集类别异常的类别修正。决策树的生成和剪枝本质上是完成基于基尼指数和信息熵的连续条件属性数据空间分割和合并类别修正。实验和实际应用验证了决策树生成和剪枝是数据集类别优化的有效方法。
- 李国和王峰郑阳王峰洪云峰吴卫江
- 关键词:信息熵基尼指数决策树剪枝数据优化
- 基于Spark的人工蜂群改进算法被引量:4
- 2017年
- 针对人工蜂群(ABC)算法求解组合优化问题时效率低的问题,提出了基于Spark云计算框架的并行ABC改进算法。首先,将蜂群划分为子蜂群并将蜂群构造为弹性分布式数据集,子蜂群使用广播机制交换优秀个体;然后,采用一系列转换算子,实现蜜蜂寻找解过程的并行化;最后,用万有引力质量计算代替轮盘赌概率计算,减少计算量。通过旅行商问题(TSP)求解说明了算法的可行性。实验结果表明:对比标准ABC算法,所提算法加速比最大达到3.24;对比未改进的并行ABC算法,该算法收敛速度提高约10%。所提算法在复杂问题求解方面优势更加明显。
- 翟光明李国和吴卫江洪云峰周晓明汪静
- 关键词:人工蜂群算法SPARK旅行商问题