北京市教育委员会科技发展计划(JC002011200903) 作品数:6 被引量:12 H指数:2 相关作者: 李建更 阮晓钢 李辉 陈思远 苏磊 更多>> 相关机构: 北京工业大学 吉林大学 更多>> 发文基金: 北京市教育委员会科技发展计划 国家科技重大专项 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 生物学 更多>>
基于多数据集的胃癌亚型标志基因选择 被引量:1 2013年 基于机器学习方法分析胃癌微阵列数据,寻找和发现新的胃癌亚型分类的相关基因,可为进一步研究胃癌发生的分子机制及其基因水平的诊断和治疗提供标志与依据.现有方法大多使用单个数据集提取特征基因,样本量少,提取的特征基因应用于其他同类数据分类效果差.本文提出了一种遗传算法与支持向量机(support vector machine,SVM)相结合的特征基因提取方法,并行分析了3个胃癌微阵列数据集,提取的特征基因在所有数据集中均达90%以上的分类准确率.进行了4 580次实验,统计基因在遗传算法种群中出现的次数依次排序,得出了可能对胃癌亚型分类起关键作用的基因(AGT、FBLN1等).对提取的特征基因的生物学意义分析结果表明,本方法能很好地识别胃癌亚型分类基因,所选择的特征基因对人类胃癌肿瘤的诊断和分型有重要意义. 李建更 贺益恒 郭庆雷关键词:胃癌 遗传算法 肿瘤基因选择方法LLE Score 被引量:7 2015年 针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性. 李建更 逄泽楠 苏磊 陈思远关键词:LLE SCORE 一种有效的肿瘤特征基因筛选方法 提出一种新的特征基因选择方法(PLSIPFFS),将偏最小二乘变量投影重要性指标与启发式前向搜索结合。利用PLS-VIP CFFS对胃癌、肺癌、白血病等4组基因表达谱数据进行特征基因的选择,将选择结果与支持向量机等分类方... 李建更 李辉 阮晓钢关键词:特征基因 偏最小二乘 支持向量机 特异性 敏感性 文献传递 基于逐步提取偏最小二乘主成分的特征选择方法 被引量:2 2010年 特征选择技术被广泛应用于生物信息学中。通过重复利用偏最小二乘(partial least square,PLS)方法提取主成分,通过逐次选择在主成分中权重较大的基因,将PLS应用于特征选择中。将这种方法用于对肿瘤基因表达谱数据的特征基因选择中,并用提取的特征基因分类,用8个特征基因进行分类时,能达到92.5%的正确率。 李建更 耿涛 阮晓钢关键词:偏最小二乘 主成分 肿瘤基因表达谱 样条变换偏最小二乘在肝癌数据分类中的应用 被引量:1 2011年 肝癌是中国最常见的恶性肿瘤之一。基于肿瘤基因表达谱数据的分析与研究是当今研究的热点,对于癌症的早期诊断、治疗具有十分重要的意义。针对高维小样本基因表达谱数据所显现的变量间严重共线性、类别变量与预测变量的非线性关系,采用了基于样条变换的偏最小二乘回归新技术。首先通过筛选法去除基因表达谱数据中的冗余信息,然后以3次B基样条变换实现非线性基因表达谱数据的线性化重构,随后将重构的矩阵交由偏最小二乘法构建类别变量与预测变量间的关系模型。最后,通过对肝癌肿瘤基因表达谱数据的分析,结果显示此分类模型对数据重构稳健,有效的解决了高维小样本基因表达谱数据间的过拟合和变量间的共线性,具有较高的拟合和分类正确率。 李建更 李辉关键词:基因表达谱 偏最小二乘 筛选法 过拟合 决策森林法在胃癌基因信号通路分析中的应用 2011年 DNA微阵列分析为识别疾病类型及鉴别特征基因等生物研究提供了重要的研究手段,但目前大量使用的基于单基因的分析方法受样本数量和噪音的影响较大,无法呈现基因间的相互关系,而基因信号通路分析则是解决这一问题的一种有效方法。结合决策森林法对胃癌数据进行了基因通道分析,对所选择基因在基因信号通路中的作用以及通路中基因之间的相互作用进行了研究,为胃癌的研究提供了新的思路。 李建更 李欣关键词:胃癌 一种有效的肿瘤特征基因筛选方法 被引量:1 2013年 提出一种新的特征基因选择方法(PLS_VIP_CFFS),将偏最小二乘变量投影重要性指标与启发式前向搜索结合。利用PLS_VIP_CFFS对胃癌、肺癌、白血病等4组基因表达谱数据进行特征基因的选择,将选择结果与支持向量机等分类方法结合未处理原数据集,考察特异性、敏感性及平均准确率等指标,并从生物学角度分析选取的特征基因。PLS_VIP_CFFS在4组数据集上选取的特征基因具有较强的生物意义,结合多种分类器所得各项指标以及分类正确率都比较高,因此,PLS_VIP_CFFS可作为一种可靠的特征基因选取方法。 李建更 李辉 阮晓钢关键词:特征基因 偏最小二乘 支持向量机 特异性 敏感性