国家高技术研究发展计划(2006AA01Z146)
- 作品数:19 被引量:37H指数:3
- 相关作者:李弼程屈丹张连海唐晖牛铜更多>>
- 相关机构:解放军信息工程大学中国人民解放军信息工程大学怀化职业技术学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国防科技技术预先研究基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- VoIP压缩码流说话人识别研究被引量:2
- 2009年
- 研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
- 唐晖李弼程屈丹张连海
- 关键词:说话人识别
- 基于分层熵检测的音频分割算法被引量:1
- 2009年
- 音频分割是提取音频结构和内容语义的重要手段,是基于内容的音频分析、检索的基础。提出分层熵检测音频分割算法,采用定长分析窗分层结构遍历音频流,窗内根据熵变化趋势检测跳变点。实验结果表明,该算法避免了ΔBIC分割算法中的硬门限判决和数据累积问题,是一种更加有效的音频分割方法。
- 王志明张瑞杰李弼程
- 关键词:音频分割
- 基于HMM的英语文语转换系统被引量:3
- 2008年
- 研究了基于隐马尔可夫模型(HMM:Hidden Markov Model)的语音合成系统的关键技术,在此基础上,借助HTK和Festival等工具,以基频和声道谱参数为训练参数,实现了一个基于HMM的英语文语转换系统,主观试听,合成的语音流畅、清晰可懂,并把混合激励应用到系统中对激励进行改进,提高了自然度。实验结果表明,利用HMM技术实现合成单元的选择,较好地解决了文语转换系统中的协同发音的问题。
- 冯志红张连海吴保民
- 关键词:隐马尔可夫模型语音合成文语转换
- 基于语音质量参数的语音传输信道检测算法
- 2011年
- 针对不同编码算法对语音质量的影响,采用语音质量改进参数构造特征矢量,提出了一种基于SVM多级判决的语音编码检测算法,实现了对不同信道的识别。采用统计方法对这组参数的区分性进行了分析,在此基础上设计了一种高效的信道检测方案,结合实际数据,测试了算法性能,并分析了语音长度对性能的影响。实验结果表明,该算法能有效地提高信道检测准确率。
- 陈斌张连海牛铜屈丹
- 关键词:信道检测高阶累计量
- 一种改进的基于经验模态分解的小波阈值滤波方法被引量:10
- 2008年
- 经验模态分解是一种新的信号分解方法,该方法可将非线性非平稳信号分解成若干个单分量的本征模态函数,使得每个本征模态函数都具有一定的物理意义。本文探索了该方法在语音增强方面的应用.在文献[8]的基础上,对其方法进行了有效改进。首先将带噪语音进行经验模态分解,得到六个本征模态函数和一个余量信号,对这七个信号分别进行小波阈值滤波,并由滤波后的七个信号重构语音。结果表明,该方法的滤波效果明显优于对带噪语音直接采用小波阈值滤波的方法,并且较之文献[8]的滤波方法也具有一定的优势。
- 王民李弼程张文林
- 关键词:经验模态分解小波变换
- 一种针对ISF参数的量化算法
- 2009年
- 宽带语音编码中普遍使用导抗谱频率描述声道。利用转换分类差矢量分裂矢量量化方法对导抗谱频率进行量化,该方法基于转换分类矢量量化及差值分裂矢量量化。ISF矢量先按照给出的码书分类,然后每一类中的差矢量再进行分裂矢量量化。实验结果表明,该算法可在每帧编码比特数为37时达到透明量化要求,并且码书存储量明显少于Stephen So等人给出的转换分类分裂矢量量化方法。
- 王军张连海屈丹
- 关键词:矢量量化
- 基于加权最小统计的噪声谱估计改进算法被引量:7
- 2009年
- 针对最小统计的噪声谱估计算法在噪声谱上升时跟踪时延较大的问题,该文给出了一种加权最小统计的噪声谱估计改进算法,通过分析加权对最小统计噪声谱估计算法的影响,采用3种简单典型曲线构造权值,用实验的方法比较得出由余弦曲线构造的权值最优。实验结果表明加权最小统计的噪声谱估计改进算法能够快速跟踪噪声谱的变化,提高了噪声谱估计的准确性,改善了增强后的语音质量。
- 牛铜张连海屈丹
- 关键词:语音增强
- 一种新的噪声自相关估计方法被引量:1
- 2009年
- 通过分析带噪语音、纯净语音和噪声的自相关关系,在均方误差最小准则下给出了一种基于最优平滑滤波和能量最小算法相结合的噪声自相关无偏估计算法,与传统的噪声自相关估计不同,该算法直接从带噪语音自相关中估计噪声自相关。实验表明,该算法优于传统的噪声自相关估计算法,在非平稳噪声环境下,估计器的性能得到改善。
- 牛铜张连海屈丹
- 关键词:语音增强子空间
- 基于VQ-GMM的音频分类被引量:1
- 2008年
- 音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明该方法的分类性能良好,平均正确率可达95%。
- 张瑞杰李弼程张连海屈丹
- 关键词:音频分类
- 基于最小方差无失真响应谱的语音特征提取被引量:2
- 2008年
- 对最小方差无失真响应谱进行了研究,并将其应用到语音特征参数的提取中,对传统的美尔频率倒谱系数提取方法进行了有效的改进。该方法首先计算短时语音信号的最小方差无失真响应谱,在该谱的基础上提取美尔频率倒谱系数。基于最小方差无失真响应谱的美尔频率倒谱系数在保留语义信息的同时有效抑制了说话人信息,更加适合于关键词检出。
- 王民李弼程屈丹
- 关键词:美尔频率倒谱系数关键词检出