王丹丹
- 作品数:3 被引量:7H指数:2
- 供职机构:江南大学理学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学理学更多>>
- AABC-SVM模型及其在商品评论情感分类中的应用被引量:5
- 2017年
- 为了提高商品评论情感分类准确率,解决传统SVM分类时参数难以选择问题,在基本人工蜂群算法基础上,提出一种改进人工蜂群算法AABC(Advanced Artificial Bee Colony)来优化支持向量机(SVM)参数。以最小化商品评论分类错误率为优化目标,在人工蜂群算法的引领蜂阶段引入监督-响应机制增强蜂群算法开发能力,在跟随蜂阶段改进概率选择作用保证蜜源个体的差异性,提高算法收敛速度,避免算法陷入局部最优。不同商品评论情感分类结果表明,相比于GA-SVM模型、PSO-SVM模型和ABC-SVM模型,所提出的AABC-SVM模型能够寻优到更好的SVM参数组合,其分类准确率平均多提高了1%~3%,验证了所提模型的有效性。
- 王丹丹祖颖朱平
- 关键词:人工蜂群算法支持向量机情感分类
- 基于拟比对CNN方法的人类p53癌症基因二级数据库构建及分析被引量:2
- 2019年
- 以NCBI维护的一级数据库为数据源建立人类癌症p53核苷酸序列二级数据库,该数据库设计主要包括4个方面:癌症信息、p53序列信息、样本信息和参考文献信息。以XML格式为中间格式保存一级数据库数据,并通过解析提交到二级数据库,初步实现数据的检索、链接和统计分析等功能。本文提出一种拟比对CNN方法对p53癌症基因序列进行比对分析,通过改善传统CNN相似度评估公式,增强两序列全局比对相似度的敏感性和可靠性。结果表明,将改进的序列比对算法应用于乳腺癌和非小细胞肺癌p53外显子基因序列比对,发现外显子5突变后序列比对结果存在较大差异,可以作为区别这两种癌症的参考。此外,通过将一级数据库以XML形式转化成二级数据库,实现了网络数据与本地数据的动态交换。
- 王丹丹李晨鸿徐海阳蔡蓉朱平
- 关键词:癌症细胞神经网络
- 一种兼具生物和物理特征的E基因签名方法——以p53家族基因为例
- 2017年
- 在原来的具有生物特性的基因签名方法上,引入具有一定的物理特性的核苷酸游离电子的平均能量(EIIP),建立了一种新的E基因签名方法。定义了两序列间的E欧氏距离及e均方差公式,并对相关物种进行层次聚类分析。通过对20个物种的p53家族基因m RNA完整的CDS序列进行E基因签名得出,在每种基因中均有,物种关系越近,其基因签名相似度越高。将聚类结果与原来的基因签名方法的聚类结果作对比,发现了E基因签名方法更准确,从而更有利于深入了解p53家族基因的性质。
- 蔡蓉钱东王丹丹朱平
- 关键词:层次聚类分析