陈梦喆
- 作品数:4 被引量:4H指数:1
- 供职机构:中国科学院更多>>
- 发文基金:中国科学院战略性先导科技专项国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 多领域系统融合在语音云系统中的应用
- <正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能...
- 陈梦喆张晴晴颜永红
- 文献传递
- 多领域系统融合在语音云系统中的应用
- 2013年
- 0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能涉及不同领域,语言的风格以及用词都有很大区别,这对于语音识别技术是一大挑战。
- 陈梦喆张晴晴颜永红
- 关键词:手机应用声学模型移动终端语言模型测试集
- 多领域系统融合在语音云系统中的应用
- 本文针对语音云系统的应用中,用户语音识别涉及领域多的问题,比较了包含各领域的通用系统和分领域识别系统的性能,结果表明分领域识别比采用通用系统有明显优势。分领域识别有前端领域判别和后端结果融合的两种方法,采用后端结果融合的...
- 陈梦喆张晴晴颜永红
- 关键词:信号处理解码器声学模型
- 语音识别中深度神经网络目标值优化被引量:4
- 2016年
- 训练深度神经网络声学模型时,所采用的强制对齐得到的目标值存在无法精准地表示出语音实际状况的问题。针对这一问题,提出一种利用前后向算法得到非0-1分布目标值的方法。由于用于强制对齐的模型可能与处理语句不完全匹配,以及发音连续性导致的过渡边界难以分离等问题,强制对齐得到的目标值存在不合理性。新的目标值可以表示某一帧以一定概率属于邻近各状态的分布情况,更详细地描述建模单元之间的过渡,进一步还原语音的原貌,提升模型的鲁棒性。同时,为寻求模型鲁棒性和建模单元区分度之间的平衡,对算法得到的目标值进行加窗处理。在中文客服问答领域进行实验,在小数据量上验证了目标值对于训练的较大影响,并且选取窗长宽度这一参数。最后将训练数据量提升至60、80以及100 h,结果显示,新的目标值优化方法训练得到的模型在识别性能上获得提升,相对字错误率下降为1.10%~3.65%。多组实验验证新的目标值优化方法对模型训练有一定效果,在训练数据量上升的情况下依然具有有效性。
- 陈梦喆张晴晴潘接林颜永红
- 关键词:语音识别