张晓凤
- 作品数:2 被引量:20H指数:2
- 供职机构:哈尔滨医科大学更多>>
- 发文基金:国家自然科学基金中国博士后科学基金更多>>
- 相关领域:医药卫生生物学更多>>
- 基于AUC统计量的随机森林变量重要性评分的研究被引量:15
- 2016年
- 随机森林(random forest,RF)是高维组学数据常用的分析方法,在进行判别分析时,同时能够给出变量重要性评分(variable importance measure,VIM)。RF的变量重要性评分通常有两种,一种方法是通过变量值的置换计算其重要性,第二种方法是通过基尼(Gini)指数计算其重要性,由于置换法比Gini指数法具有更好的非偏倚性能,因此多采用置换法进行变量筛选。
- 张晓凤侯艳李康
- 关键词:AUC置换法统计量分类器
- 高维组学数据的变量筛选方法及其应用被引量:5
- 2016年
- 随着生物检测技术的不断发展,实际中可以获得基因组、蛋白质组和代谢组等各种来源的高维组学数据,如何从海量数据中准确选择与疾病有关的特征变量,从而构建准确的预测模型一直是国内外的研究热点。
- 侯艳谢宏宇张晓凤李康
- 关键词:遗传算法马尔科夫评价函数过拟合主成分分析