李红军 作品数:10 被引量:62 H指数:5 供职机构: 成都理工大学信息科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家科技支撑计划 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 理学 一般工业技术 更多>>
UTR^*-Tree:受限网络中移动对象不确定轨迹索引模型 被引量:3 2010年 受限网络中移动对象不确定轨迹的有效索引是移动对象数据库中的研究重点。针对现有方法的不足,提出了一种新的不确定轨迹索引结构UTR*-Tree。该索引结构采用静态和动态相结合存储管理移动对象,将变化极小的受限道路网络作为静态部分使用2维空间R*-Tree进行管理;将移动对象位置则作为动态信息采用R*-Tree和Hash数组协同管理。借助该结构,移动对象数据库不仅可以快速地处理对移动对象过去可能位置的查询,而且能够对其现在及将来的可能位置进行高效的查询处理。实验结果表明同目前有代表性的轨迹索引结构UTR-Tree相比,该索引结构在维护性能上提高了一个数量级,在查询性能上平均提高了约25%。 李红军 唐常杰 乔少杰 代术成 王悦 郑皎凌关键词:移动对象数据库 不确定性 索引 一种改进的遗传算法 2003年 传统的遗传算法有2个严重的缺点,即不能有效地消除过早收敛现象以及在进化后期搜索效率较低。模拟退火算法是基于金属退火的机理而建立起来的1种全局最优化方法,它能够以随机搜索技术从概率的意义上找到目标函数的全局最小点。将遗传算法与模拟退火算法相结合,提出模拟退火遗传算法。实验结果表明,该算法在性能上有较大的改善。 李红军 覃仁超关键词:遗传算法 模拟退火算法 随机搜索 模拟退火遗传算法 模拟退火遗传算法的性能评价 被引量:13 2003年 遗传算法和模拟退火算法的结合对遗传算法的性能有很大的改进.将遗传算法与模拟退火算法相结合,提出了模拟退火遗传算法.研究结果表明,该算法能较好地克服传统遗传算法存在的不足,并在进化速度和全局寻优能力方面有较大的突破. 李红军关键词:遗传算法 模拟退火算法 模拟退火遗传算法 进化速度 性能评价 机器视觉在大型工件自动探伤检测中的应用 2005年 大型金属工件探伤一般用无损检测法,技术难度高、工程量大,往往难以获得高精度的测量准确值。针对机器视觉产品将被摄取目标转换成图像信号后,多数都还依赖于手工进行处理问题,文章提出了一种基于边缘提取的工业CT(断层)图像几何尺寸的自动测量方法。该方法采用Canny算子提取图像边缘信息,并在图像边缘上实现对大型工件CT图像的内部结构尺寸和缺陷尺寸的自动测量。该方法已成功地应用于工业CT图像处理软件中,实际应用表明,它具有较高的精确度和重复性。 覃仁超 李红军关键词:工业CT CANNY算子 基于基因表达式编程的复杂网络自动聚簇算法 被引量:1 2012年 在无先验知识的前提下,复杂网络聚簇需确定簇数并精确地将节点分配到其所属簇,而大部分传统聚簇方法无法自动确定簇数。为解决这一问题,结合GEP和信息论聚类框架,提出了复杂网络自动聚簇算法——AutoC-NC-GEP。算法为复杂网络聚簇建立了GEP结构模型,设计了有效的遗传算子,提出了"不完全聚簇划分"概念,并分别以Map Eqation和Modularity两种不同的网络社团结构量化函数为适应度函数,使用真实网络对算法的聚簇性能进行了测试。实验结果表明,在没有先验知识的前提下,AutoCNC-GEP算法不仅能正确解析网络的社团数量,还可以自动将节点精确地分配到其所属社团中,从而获得网络的最佳社团结构。 汤蓉 唐常杰 徐开阔 左劼 李红军关键词:基因表达式编程 基于流信息距离的多文本流热点挖掘 被引量:5 2011年 把文本流中的热点区分为局部热点和全局热点,分析了二者的相关性,并将Kolmogorov复杂度应用于多文本流中的热点挖掘.首先,定义了基于Kolmogorov复杂度的冗余信息的概念,并论证了文本流存在局部热点的必要条件是冗余信息超过某个阈值;其次,基于条件Kolmogorov复杂度提出了一个相似性度量指标——流信息距离(stream information distance,简称SID),以衡量不同文本流之间的相似度;并借鉴计算生物学领域中的种系发生树的思想,提出了一种基于层次聚类的多文本流全局热点挖掘启发式算法.在合成和真实数据集的实验,验证了算法的收敛性、有效性和规模可伸缩性. 杨宁 唐常杰 王悦 陈瑜 郑皎凌 李红军关键词:冗余信息 在不确定数据集上挖掘优化的概率干预策略 被引量:6 2011年 提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了大量实验比较,验证了所提出的干预策略评价优化算法具有较高精度,效率比朴素方法高出3个数量级,适合在实际系统中处理海量干预评价. 王悦 唐常杰 杨宁 张悦 李红军 郑皎凌 朱军关键词:不确定数据 数据挖掘 海量数据分析 基于前后文n-gram模型的古汉语句子切分 被引量:26 2007年 提出了基于前后文n-gram模型的古汉语句子切分算法,该算法能够在数据稀疏的情况下,通过收集上下文信息,对切分位置进行比较准确的预测,从而较好地处理小规模训练语料的情况,降低数据稀疏对切分准确率的影响。采用《论语》对所提出的算法进行了句子切分实验,达到了81%的召回率和52%的准确率。 陈天莹 陈蓉 潘璐璐 李红军 于中华关键词:N-GRAM模型 数据稀疏 基于伪属性语义匹配的Deep web信息抽取 被引量:5 2009年 已有的Deep Web信息抽取算法主要对结构规范的网页进行模版的提取,目前多数Deep Web网页在结构上是非规范的,网页中记录属性字段可能缺失或重复、原子属性字段可能被html标签分隔。为了正确抽取这些非规范网页,提出了一种新方法:引入了记录的伪属性及其语义匹配概念,通过实现记录间伪属性序列的语义匹配实现信息抽取;提出了伪属性序列的模型及其语义匹配算法和记录Wrapper模型及其生成算法。实验表明,在结构不规范deep web网页的抽取上,能达到91%的查全率和93%的查准率,相对其它算法有一定优势。 郑皎凌 唐常杰 姜玥 杨宁 李红军关键词:DEEP WEB 信息抽取 语义匹配 用态势模型预测基因表达式编程的进化难度 被引量:3 2011年 在基因表达式编程(gene expression programming,简称GEP)中,由于不同问题得到的适应度-距离相关系数(fitness-distance correlation,简称FDC)值很相近,所以难以用FDC预测GEP求解不同问题的进化难度.为了解决该问题,提出了态势模型及其区间密度指标来预测GEP的进化难度.主要工作包括:(1)提出了GEP染色体之间的距离和态势模型的新概念;(2)提出了态势模型中的区间密度指标;(3)从动力学角度证明了态势模型是对GEP原搜索空间的一种映射,并且该映射保持了种群在原搜索空间中移动的动力学性质;(4)分析了用态势模型区间密度预测GEP进化难度的合理性;(5)用实验验证了区间密度能够准确预测GEP求解问题的进化难度. 郑皎凌 唐常杰 徐开阔 杨宁 段磊 李红军关键词:空间映射