钟义啸
- 作品数:8 被引量:93H指数:3
- 供职机构:四川大学计算机学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金四川省青年软件创新工程基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于基因表达式编程的知识发现的三项新技术——转基因,重叠基因表达和回溯进化被引量:21
- 2005年
- 介绍了在研发基于基因表达式编程(GEP)的知识发现的三项新技术,包括:(a)转基因技术,通过注入转基因,引导进化方向,控制知识发现过程;(b)重叠基因表达,借鉴生物基因片段重叠表达,引入重叠基因概念,节约了表达空间;(c)回溯进化,借鉴生物“返祖现象”,引入回溯检查点概念和可回溯GEP算法、设计了等比递增检查点序列和加速递增检查点序列,约束回溯过程。实验表明,三项技术在一定的场合下分别提高了知识发现的性能1至2个数量级。
- 唐常杰彭京张欢钟义啸
- 关键词:知识发现基因表达式编程转基因
- 频繁函数集的可配置挖掘算法
- 函数挖掘是数据挖掘的重要研究方向.传统的函数挖掘有两个局限性:①挖掘目标是单个函数,但单个函数对现实世界中规律的描述能力很弱;②它难以被应用在复杂的数据集上.为了弥补这些缺陷,做了如下探索:①提出了新的、描述能力更强的函...
- 贾晓斌唐常杰钟义啸赵波
- 文献传递
- 基因表达式编程的早熟抑制策略研究
- 数据挖掘已经成为当前数据库研究开发和应用的热点,函数挖掘是数据挖掘技术的重要研究方向。进化计算常常被用于自动的函数关系发现,基因表达式编程(GEP)具有编码简单,适应性强的优点,同时继承了遗传算法的简单性和遗传编程求解复...
- 钟义啸
- 关键词:数据挖掘函数挖掘进化计算基因表达式编程
- 文献传递
- 正态分布下基于隐Markov模型的多声道MIDI音乐检索被引量:2
- 2006年
- 音乐查询是信息检索领域的一个研究热点.分析了现有方法应用范围局限性和低效率的原因,讨论了用户哼唱和多声道MIDI特征序列的表达方法,提出新的基于内容的多声道MI-DI检索模型HMRM(Homophonic MIDI Retrieval Model).新模型将多声道音乐表达成一个隐Markov模型,计算哼唱对象与库中对象的相似度并排序返回查询结果.实验表明,对于不同哼唱水平的用户,HMRM的识别率平均能达到73.3%,具有较高的查准率.
- 徐开阔唐常杰段磊魏大刚钟义啸乔少杰
- 关键词:信息检索多声道音乐
- 提高基因表达式编程发现知识效率的回溯策略被引量:13
- 2006年
- 传统基因表达式编程(GEP)编码简单,适应性强,但可能陷入局部最优的“早熟”陷阱.因此,作者借鉴生物界的“返祖现象”,提出了基于回溯的基因表达式编程方法.主要工作包括:(1)在传统GEP算法中引入回溯机制,提出基于回溯策略的GEP算法GEPBS(GEP withBacktracking Strategy);(2)提出回溯检查点概念,设计等比递增检查点序列和加速递增检查点序列,约束回溯过程;(3)扩充基于回溯的GEP算法,设计了退化因子(RF),提出了按比例回溯策略GEPPBS(GEP with Proportional Backtracking Strategy);(4)通过两个实验验证了新算法的有效性,在相同条件下较传统算法的适应度最大提高了49.2%,成功率最高提高了4倍.
- 钟义啸唐常杰陈宇段磊魏大刚
- 基于基因表达式编程的抗噪声数据的函数挖掘方法被引量:60
- 2004年
- 用传统基因表达式编程 (GEP)适应度机制挖掘函数关系容易受到噪声干扰 ,导致结果失真 为此做了如下探索 :①借鉴生物具有的“趋利避害”天性 ,提出了GEP的“弱适应模型” ,以实现在含噪声的数据集上挖掘函数关系 ;②提出新概念“带内集”、“带外集”并用于划分训练数据集 ;③设计了在弱适应模型下基于相对误差计算适应度的算法RE FA ;④用详尽的实验验证了REFA的有效性 ,当测量数据的噪声率为 3 33%时 ,与传统方法相比 ,REFA方法的成功率提高了 3倍 ,产生结果的平均相对误差从 7 899%降低到 2 32 0 %
- 段磊唐常杰左劼陈宇钟义啸元昌安
- 关键词:基因表达式编程噪声数据适应度函数挖掘
- 基于最优投影和动态阈值的最近邻搜索算法被引量:3
- 2006年
- 作者在前人工作成果的基础上,提出并实现了一种基于最优投影和动态阈值调整的最近邻搜索算法DTA(Dynamic Threshold Algorithm);证明了最优投影线定理和投影邻域定理;并分析了DTA算法与SNN算法相比在算法性能上的优势.实验结果表明,当数据规模增大时,DTA算法的运行时间增加相对缓慢,在大规模数据集上DTA算法的运行时间可达传统算法的10%以下;DTA算法对阈值的变化不敏感,能适应不同分布的数据集合.
- 魏大刚唐常杰段磊钟义啸朱军蒋永光
- 关键词:最近邻搜索数据挖掘
- 基于基因表达式编程和时变强度的时间序列预测
- 序列分析是数据挖掘和统计学领域的一类典型问题,GEP应用在时间序列分析中得到了不错的效果,但是传统的GEP SWPM算法有嵌入维度难以制定的缺点.本文在GEP挖掘的基础上引入了统计时间序列分析的预处理方法,用自相关系数将...
- 陈宇唐常杰钟义啸段磊乔少杰普东航
- 关键词:基因表达式编程时间序列预测数据挖掘