俞一彪
- 作品数:114 被引量:358H指数:9
- 供职机构:苏州大学更多>>
- 发文基金:国家自然科学基金苏州市科技计划项目(应用基础研究计划)江苏省高校自然科学研究项目更多>>
- 相关领域:电子电信自动化与计算机技术文化科学理学更多>>
- 基于VQ的病症脉象识别系统的实现被引量:1
- 2008年
- 结合传统中医理论和现代信号处理技术以脉象信号的LPC系数、LPC倒谱系数和MEL频率倒谱参数作为识别的特征矢量,运用VQ模型对胃癌、肺癌、乳腺癌等病症患者的脉象信号进行建模以及识别的研究。此研究为病症脉象识别和辅助诊断疾病提供了一种有效的方法。
- 彭涛俞一彪
- 关键词:脉诊特征提取
- 语音识别浏览器VoiceIE
- 俞一彪赵鹤鸣肖筱华陈雪勤段凯宇
- 该课题为合作项目,由远光电子(北京)有限公司委托开发并完成。浏览器是因特网信息检字浏览的必备工具,但目前的浏览器都必须由键盘输入英文或中文网址进行搜索浏览,这对广大用户来说极不方便,不仅表现在记忆上,而且表现在输入手段上...
- 关键词:
- 关键词:语音浏览器因特网
- 非线性频谱变换的说话人识别性能分析
- 本文分析非线性频谱变换对说话人识别系统性能的影响.首先对反映人耳听觉感知特性的三种典型非线性频谱变换,即Mel尺度频谱变换、BARK尺度频谱变换和ERB尺度频谱变换特性进行了分析与描述,并在频率变换域提取语音信号的倒谱特...
- 袁冬梅俞一彪颜祥戴志强
- 关键词:语音识别听觉感知语音信号
- 文献传递
- 基于互信息理论的说话人识别研究
- 基于生物特征的身份识别技术是当前国际上的重点研究内容,自动说话人识别通过语音识别说话人的身份,在系统安全认证、司法鉴定、金融服务以及电子侦听等领域有着广泛的应用价值.本文在对现有说话人识别技术分析的基础上,运用互信息理论...
- 俞一彪
- 关键词:说话人识别互信息语义特征
- 一种语音信号线谱对参数的优化算法被引量:3
- 2007年
- 提出了一种计算语音信号线谱对(LSP)参数的新算法.LSP参数可以通过求解一个与线性预测系数(LPC)相关的非线性N阶方程得到.首先利用埃特金迭代法求高阶非线性方程的一个实数根,再采用多项式综合除法降阶,最后运用费拉里算法求解一元四次方程的根,得到LSP系数.理论分析以及基于TMS320C5510 DSP的实验结果表明,文中提出的算法与目前的算法相比,不仅计算精度高、运算量小,完全可以实时处理,而且并可应用于G.729A标准等低码率实时语音传输系统.
- 李娟娟俞一彪芮贤义
- 关键词:线谱对参数线性预测系数
- 噪声环境下说话人识别的组合特征提取方法被引量:17
- 2006年
- 针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。
- 芮贤义俞一彪
- 关键词:说话人识别小波变换矢量量化
- 短时频谱通用背景模型群联合韵律的年龄语音转换被引量:3
- 2017年
- 提出一种短时频谱通用背景模型群与韵律参数相结合进行年龄语音转换的方法。谱参数转换方面,同一年龄段各说话者提取语音短时谱系数并建立高斯混合模型,然后依据语音特征相似性对说话者进行聚类,每一类训练一个通用背景模型,最终得到通用背景模型群和一组短时频谱转换函数。谱参数转换之后再对共振峰进一步微调。韵律参数转换方面,基频和语速分别建立单高斯和平均时长率模型来推导转换函数。实验结果显示,提出的方法在ABX和MOS等评价指标上比传统的双线性法有明显的优势,相对单一通用背景模型法的对数似然度变化率提高了4%。这一结果表明提出的方法能够使转换语音具有良好目标倾向性的同时有较好的语音质量,性能较传统方法有明显提升。
- 惠琳俞一彪
- 关键词:语音高斯混合模型基频正韵律
- 具有仿冒攻击检测的鲁棒性说话人识别
- 2022年
- 仿冒攻击严重影响说话人识别系统的安全应用。文中提出了一种具有录音回放仿冒攻击检测能力的说话人识别系统,该系统采用前端攻击检测与后端说话人确认的串联结构,并通过信道频响分析和说话人个性特征分析提出了一种信道频响差强化倒谱系数(Channel frequency response Difference Enhancement Cepstral Coefficient,CDECC),该特征参数通过三阶多项式非线性频率尺度变换同时强化语音信号低频段和高频段的频谱分量,能够有效反映不同输入信道频率响应和不同说话人语音频谱的差异。基于ASVspoof 20172.0数据库的非特定说话人文本无关录音回放攻击检测的实验表明,采用CDECC的录音回放攻击检测等错率(EER)为25.03%,相比基线系统下降了10%。通过在说话人确认的前端嵌入录音回放攻击检测模块,说话人识别系统的错误接受率(FAR)明显下降,系统EER从3.32%下降为1.01%,鲁棒性得到有效提升。
- 郭星辰俞一彪
- 关键词:说话人识别说话人确认
- 基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强被引量:4
- 2008年
- 分析了理想情况下离散余弦变换域中语音信号增益,先验信噪比及后验信噪比之间的关系,用实际数据获得了各种信噪比下增益范围的统计特性。基于语音呈Laplace分布、噪声呈Gauss分布的模型,推导了具有相位特性的增益及先验信噪比的估计公式,通过合理性分析得到了简化的相位判别准则。实验结果表明,在高斯白噪声和F16飞机噪声情况下,简化的相位判别可使低信噪比下的语音增强系统的性能得到较大的改善。
- 吴红卫俞一彪吴镇扬
- 关键词:LAPLACE分布语音增强系统离散余弦变换域GAUSS模型信号增益
- 说话人性别识别系统的DSP实现被引量:2
- 2005年
- TM S320VC 5416 DSP是德州仪器公司近年来推出的16位定点数字信号处理器,他不但运算速度快,而且功耗低,是目前全球应用最广泛的DSP芯片。介绍了利用TM S320VC 5416 DSP实现实时说话人性别识别系统。系统采用循环平均幅度差函数(CAM DF)检测基音周期,能够快速、有效的判别说话人的性别。另外,采用DSP/B IO S开发工具编写代码,大大降低了代码的执行时间,满足实时的需求。经过对系统的反复测试,证明其具有较高的可靠性和实时性,所以有广泛的应用空间和良好的市场前景。
- 李娟娟俞一彪薛广荣
- 关键词:数字信号处理器性别识别基音周期