您的位置: 专家智库 > >

汪雪红

作品数:2 被引量:0H指数:0
供职机构:上海师范大学信息与机电工程学院更多>>
相关领域:生物学农业科学更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇生物学
  • 1篇农业科学

主题

  • 1篇有损压缩
  • 1篇数据聚类
  • 1篇聚类
  • 1篇基因
  • 1篇基因聚类
  • 1篇高斯
  • 1篇高斯分布
  • 1篇BASED_...
  • 1篇CLUSTE...
  • 1篇CODING
  • 1篇LENGTH

机构

  • 2篇上海师范大学
  • 2篇上海交通大学

作者

  • 2篇黄继风
  • 2篇汪雪红
  • 2篇焦清局
  • 2篇常盼盼

传媒

  • 1篇安徽农业科学
  • 1篇Agricu...

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
Genetic Data Clustering Based on Minimum Coding Length
2012年
[Objective] This paper aimed to provide a new method for genetic data clustering by analyzing the clustering effect of genetic data clustering algorithm based on the minimum coding length. [Method] The genetic data clustering was regarded as high dimensional mixed data clustering. After preprocessing genetic data, the dimensions of the genetic data were reduced by principal component analysis, when genetic data presented Gaussian-like distribution. This distribution of genetic data could be clustered effectively through lossy data compression, which clustered the genes based on a simple clustering algorithm. This algorithm could achieve its best clustering result when the length of the codes of encoding clustered genes reached its minimum value. This algorithm and the traditional clustering algorithms were used to do the genetic data clustering of yeast and Arabidopsis, and the effectiveness of the algorithm was verified through genetic clustering internal evaluation and function evaluation. [Result] The clustering effect of the new algorithm in this study was superior to traditional clustering algorithms, and it also avoided the problems of subjective determination of clustering data and sensitiveness to initial clustering center. [Conclusion] This study provides a new clustering method for the genetic data clustering.
汪雪红焦清局常盼盼黄继风
基于最小编码长度的基因数据聚类
2012年
[目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。
汪雪红焦清局常盼盼黄继风
关键词:基因聚类有损压缩高斯分布
共1页<1>
聚类工具0