张利鹏
- 作品数:5 被引量:15H指数:2
- 供职机构:清华大学计算机科学与技术系更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于分数规整的发音方式鲁棒的说话人识别研究
- 实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化的数据库为基础,对于不限定发音方式变化类型的情形,在分数...
- 王琳琳张利鹏徐明星
- 关键词:说话人识别鲁棒性发音方式
- 文献传递
- 基于分数规整的发音方式鲁棒的说话人识别被引量:2
- 2009年
- 实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。该文以一个含有多种发音方式变化的数据库为基础,对于不限定发音方式变化类型的情形,在分数域提出了一系列发音方式分数规整(S-Norm)的解决方法。实验结果表明:SZ-Norm、ST-Norm及SZT-Norm的做法均使系统的整体性能在基线基础上有了明显提高,尤其是在SZT-Norm的情况下等错误率下降约为27%,这说明基于分数规整的方法是有效的。
- 王琳琳张利鹏徐明星
- 关键词:说话人识别鲁棒性发音方式
- 防止假冒者闯入说话人识别系统被引量:13
- 2008年
- 如何防止假冒者闯入,是说话人识别研究中的重要课题之一。回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式。该文针对用高保真录音来闯入系统进行了初步探索。高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化。通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统。以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入。实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右。
- 张利鹏曹犟徐明星郑方
- 关键词:说话人识别
- 多发音方式下的说话人识别研究
- 人在说话的时候有各种各样的发音方式,如不同的语言;带情感的发音;快速与慢速、大声与小声等等。如果不做任何处理,直接用传统的说话人识别方法来处理,结果会比较差。因此,本论文研究如何降低由人的发音方式不同而导致的说话人识别性...
- 张利鹏王琳琳徐明星
- 关键词:发音方式鲁棒性
- 文献传递
- 基于分数规整的发音方式鲁棒的说话人识别研究
- 实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化的数据库为基础,对于不限定发音方式变化类型的情形,在分数...
- 王琳琳张利鹏徐明星
- 关键词:说话人识别鲁棒性发音方式
- 文献传递