王雄飞
- 作品数:6 被引量:6H指数:2
- 供职机构:南京农业大学更多>>
- 发文基金:中央高校基本科研业务费专项资金江苏省自然科学基金江苏省博士后科研资助计划项目更多>>
- 相关领域:生物学自动化与计算机技术更多>>
- 基于相似性比对改进KNN的蛋白质亚细胞定位预测研究
- 蛋白质的功能与其所处的亚细胞区间紧密相关,通过对蛋白质的亚细胞区间预测研究能够帮助我们了解蛋白质的功能信息,对于生物研究有重要意义。传统通过实验的方式获得蛋白质亚细胞区间信息不仅耗时久、成本高,而且不利于大量蛋白序列的区...
- 王雄飞
- 关键词:KNN分类器ADABOOST算法BAGGING算法
- 文献传递
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法,该方法包括以下步骤:(1)、以AAC特征向量作为蛋白序列的特征,用LSH方法将训练集中的各蛋白序列的AAC特征向量存放在多个哈希表中;(2)、预测时,用LSH方法计算出目标...
- 薛卫王雄飞赵南任守纲
- 文献传递
- 集成改进KNN算法预测蛋白质亚细胞定位被引量:3
- 2017年
- 基于Adaboost算法对多个相似性比对K最近邻(K-nearest neighbor,KNN)分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法。
- 薛卫王雄飞赵南杨荣丽洪晓宇
- 关键词:NEIGHBORALIGNMENTADABOOST
- 相似性比对预测蛋白质亚细胞区间被引量:1
- 2016年
- 【目的】对蛋白质所属的亚细胞区间进行预测,为进一步研究蛋白质的生物学功能提供基础。【方法】以蛋白质序列的氨基酸组成、二肽、伪氨基酸组成作为序列特征,用BLAST比对改进K最近邻分类算法(K-nearest neighbor,KNN)实现蛋白序列所属亚细胞区间预测。【结果】在Jackknife检验下,数据集CH317三种特征的成功率分别为91.5%、91.5%和89.3%,数据集ZD98成功率分别为93.9%、92.9%和89.8%。【结论】BLAST比对改进KNN算法是预测蛋白质亚细胞区间的一种有效方法。
- 王雄飞张梁薛卫赵南徐焕良
- 关键词:KNNBLAST
- 词袋模型在蛋白质亚细胞定位预测中的应用被引量:5
- 2017年
- 运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预测的准确率。
- 赵南张梁薛卫王雄飞任守纲
- 关键词:K-MEANS支持向量机
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法,该方法包括以下步骤:(1)、以AAC特征向量作为蛋白序列的特征,用LSH方法将训练集中的各蛋白序列的AAC特征向量存放在多个哈希表中;(2)、预测时,用LSH方法计算出目标...
- 薛卫王雄飞赵南任守纲
- 文献传递