党琰
- 作品数:3 被引量:110H指数:2
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 利用Pearson相关系数定量分析生物亲缘关系被引量:107
- 2005年
- 论文主要利用计算语言学中使用的统计学方法定量分析生物物种的亲缘关系。以包含生物体遗传信息的核酸序列为研究对象,采用计算语言学的思想和方法,将每一个生物体的核酸序列看作一篇很长的自然语言文本,抽取核酸序列的双核苷酸频率分布特征向量,用以表征其数字特征。而后采用PearsonCorrelationCoefficient(Pearson相关系数)定量分析其亲缘关系的远近程度。将119个细菌的全基因组核酸序列进行两两比对,对所得的7021个r值进行分析,得出的结论是:亲缘关系越相近的物种,其Pearson相关系数越大。取定0.985作为“属”的分界阈值时,得到召回率为75.824%,准确率为73.404%。论文对定量分析生物学核酸序列的相似性和对生物亲缘关系远近的建模有重要的实际意义。
- 张宇镭党琰贺平安
- 关键词:核酸序列自然语言文本
- 使用角色反演句法分析器RNA二级结构的预测被引量:1
- 2006年
- RNA二级结构预测问题是生物信息学的一个研究重点。该文主要利用自然语言理解中句法分析的方法来研究RNA二级结构预测。使用基于角色反演算法建立起来的,采用概率上下文无关文法进行分析的句法分析器,来预测RNA二级结构。结合传统Chart算法分析器和广义LR算法分析器的优点,建立角色反演句法分析器;根据RNA二级结构的构建方法建立相应的概率上下文无关文法;给出对RNA二级结构进行预测的具体实例。
- 党琰张宇镭张冬茉赵立平
- 关键词:RNA二级结构预测句法分析概率上下文无关文法
- 角色反演算法在问答系统中的应用被引量:2
- 2004年
- 该文介绍了如何将角色反演算法的思想用在多信息源多语种问答系统中来构建句法分析器。常用的句法分析算法由于受到语法规模大小的限制,一般都不能有效地应用到实际的自然语言处理当中。角色反演算法思想是将Chart算法的高空间效率和广义LR算法的高时间效率有效地结合起来,从而大大提高了综合的分析效率。基于多信息源多语种的问答系统,拥有大规模语法(上万条语法规则),通过引入角色反演算法思想,可以分别在问句分析模块和答句生成模块中有效地完成问句和文本答案候选文档的句法分析。
- 党琰张冬茉李芳
- 关键词:句法分析多信息源多语种问答系统