贺苏宁
- 作品数:8 被引量:11H指数:2
- 供职机构:西安电子科技大学更多>>
- 发文基金:国防基金国家部委资助项目更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 支持向量机在多语种电话语音识别中的应用
- 本文提出一种改进的支持向量机(SVM)——结果模糊化的支持向量机(PFSVM)并与one-against-one结合构造新的多分类器进行多语种识别.我们利用OGI-TS语料库提供的中文、英文、日文三种语言各约70人的话音...
- 张凡贺苏宁
- 关键词:支持向量机语种识别线性预测倒谱系数电话语音识别
- 文献传递
- 几种小训练样本集的数字语音识别模型的比较性研究被引量:2
- 2005年
- 本文通过对小训练样本集的基于DTW结构的数字语音识别模型的比较性分析,指出其存在的三个一般性问题:(1)DTW逐帧匹配模式割裂了观测向量序列的内在联系;(2)压扩观测向量序列造成局部信息使用的不均匀;(3)计算复杂度高,识别率低。为了解决这些问题,我们提出了基于数字语音时频信息整体结构的单特征向量识别模型。这种模型完整地利用了观测向量序列的全部信息,结合置信度评估和自适应反馈学习之后可及时地吸收测试向量携带的新的环境特征信息,调整识别模型结构。该模型的错识率较之最好的基于DTW结构的混合城模型的错识率降低50%以上,计算复杂度则是固定帧长模型的 13.12%。
- 贺苏宁虞厥邦
- 关键词:训练样本集置信度评估DTW
- 支持向量机在多语种电话语音识别中的应用
- 本文提出一种改进的支持向量机(SVM)——结果模糊化的支持向量机(RFSVM),并与one-against-one结合构造新的多分类器进行多语种识别。我们利用OGI-TS语料库提供的中文、英文、日文三种语言各约70人的话...
- 张凡贺苏宁
- 关键词:语种识别线性预测倒谱系数
- 文献传递
- 一种新型汉字音节整体向量模型的识别研究
- 2005年
- 通过对hiddenmarkovmodel(HMM)和segmentmodel(SM)模型的简要分析,指出了它们的某些缺陷,提出了一种新的基于汉字音节整体的Melfrequencycepstrumcoefficients(MFCC)向量模型。该模型能够根据各个音节的持续时间动态地调整帧长,进而比较完整地表现了语音时频信息的演化过程。实验数据显示,在同样的测试条件下,对于上下文相同的同性语音,帧数固定比帧长固定的识别率改善3.0%以上。还分析了几个主要影响汉字语音识别率的参数。研究表明,参数设置是否得当对于识别率有一定的影响。
- 贺苏宁虞厥邦
- 关键词:隐马尔柯夫模型
- 基于相似性和新奇度从音乐中提取代表性摘录
- 2007年
- 提出了基于相似性和新奇度提取音乐代表性摘录的方法。最大化片段与整个作品的相似性来找到最相似的摘录,最大化片段的新奇度来找到意义最丰富的摘录,并把这两个参数结合起来寻找最具代表性的摘录,同时引入数学形态滤波对音频信号预处理,消除信号中的非主要分量。实验结果表明,该方法能够找到重要的最具代表性的摘录,并且对音乐源只作了很少的假设。
- 吕波李建彬贺苏宁燕继坤
- 关键词:自相似性
- 模糊判决支持向量机在自动语种辨识中的研究被引量:2
- 2004年
- 支持向量机(SVM)是在统计学习理论的基础上发展起来的一种新的通用学习方法。自动语种辨识是语音信号处理中新出现的分支,也是一项较难的课题。该文提出的模糊判决支持向量机(FDSVM)是对支持向量机的判决结果的合理化改进,并应用于自动语种辨识系统。利用OGI-TS电话语音库对新算法的性能进行测试,然后给出实验结果。结果表明,该算法相对于传统算法是一种更有效的方法。
- 张凡贺苏宁
- 关键词:语种辨识线性预测倒谱系数
- 基于语音识别基元声学整体结构特征的识别模型研究
- 本文主要致力于自然和电话语音的端点检测、汉语音节整体结构声学识别模型的构造、低信噪比下稳健的英语数字识别模型设计与性能分析,并通过反复的实验证明新的算法和模型是可行有效的。
本文主要包括以下创新之处:
(1)...
- 贺苏宁
- 关键词:端点检测
- 基于支持向量机的多种语言话音识别研究被引量:6
- 2004年
- 提出一种改进的支持向量机 (SVM)———结果模糊化的支持向量机 (RFSVM) ,用它进行多语种识别 ,并利用OGI TS电话语音库对算法进行了测试。实验结果表明 ,该算法对于语言辨识是一种有效的方法。
- 张凡贺苏宁
- 关键词:语种识别支持向量机线性预测倒谱系数