贾磊
- 作品数:14 被引量:9H指数:2
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划教育部留学回国人员科研启动基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字更多>>
- 一种面向语音识别错误恢复的澄清式人机对话系统
- 于东贾磊徐波
- 关键词:对话管理
- 面向语音识别错误恢复的澄清式疑问句生成
- 人机对话系统中的语音识别错误将导致人机交互障碍。通过发起澄清式疑问是实现语音识别错误恢复的新思路。本文研究了澄清式疑问句生成问题,建立了人工标注的澄清疑问数据库,提出基于SVM分类器的截取模型和对齐泛化短语模型两种方法为...
- 于东贾磊徐波
- 关键词:SVM分类器
- 文献传递
- 基于检测熵变化趋势的音频特征跳变点检测
- 广播电视新闻的分割是指根据不同种类的语音的声学特征的不同,把一段连续的音频新闻按照说话人身份的不同、北景噪音的下同、说话通道的不同和背景音乐的不同等,划分成各个独立的音频数据段,然后抛弃掉与语音信息无关的音乐和噪音部分,...
- 贾磊徐波
- 关键词:声学特征音频信号音频分割音频特征
- 文献传递
- 基于共享状态空间旋转变换的相关特征建模
- 2004年
- 提出了一种共享空间旋转变换的声学建模方法。该方法结合状态空间旋转变换和方差部分共享的优点,克服了空间旋转变换方法由于每个输出都有一个变换矩阵而带来的计算量和存储量增加的缺点。在空间旋转变换方法得到比较精确的初始模型的基础上,通过共享的方差变换方法实现了不同状态的空间旋转矩阵的共享,解决了状态空间旋转变换后参数过多的缺点并提高了系统的识别率。试验结果表明,在汉语大词汇量连续语音识别系统中,同传统的对角方差建模技术相比,这种方法在计算量增加很小的情况下,系统字的误识率降低了18.8%。
- 穆向禹贾磊张树武徐波
- 关键词:语音识别系统误识率隐马尔可夫模型
- 一种面向语音识别错误恢复的澄清式人机对话系统
- 于东贾磊徐波
- 关键词:对话管理
- 具有个性化自适应能力的高性能语音处理技术及应用
- 陶建华李雅杨明浩温正棋贾磊万广鲁苏丹李秀林车浩刘斌
- 该成果属于信息传输、计算机服务和软件业领域。突破语音生成和识别技术多偏重于中性风格的局限,让计算机高准确率地识别用户口语和生成具有表现力的个性化语音。主要创新点有:基于深度学习和可自适应的高准确率语音识别技术,准确鲁棒地...
- 关键词:
- 关键词:语音识别技术语音合成
- 汉语广播电视新闻语音识别
- 该文针对汉语广播电视新闻语音识别的技术难点,主要进行了以下几个方面广泛而深入的研究.首先:在广播电视新闻语音的连续语音分割方面,该文提出基于检测熵变换趋势的音频特征跳变点检测方法,用来检测连续音频信号中的声学特征发生改变...
- 贾磊
- 关键词:说话人自适应
- 文献传递
- 基于目标驱动的多层MLLR自适应算法被引量:2
- 2003年
- 本文在对语音识别中基于自适应回归树的极大似然线性变换 (MLLR)模型自适应算法深刻分析的基础上 ,提出了一种基于目标驱动的多层MLLR自适应 (TMLLR)算法。这种算法基于目标驱动的原则 ,引入反馈机制 ,根据目标函数似然概率的增加来动态决定MLLR变换的变换类 ,大大提高了系统的识别率。并且由于这种算法的特殊多层结构 ,减少了许多中间的冗余计算 ,算法在具有较高的自适应精度的同时还具有较快的自适应速度。在有监督自适应实验中 ,经过此算法自适应后的系统识别率比基于自适应回归树的MLLR算法自适应后系统的误识率降低了 10 % ,自适应速度也比基于自适应回归树的MLLR算法快近一倍。
- 穆向禹贾磊张树武徐波
- 关键词:计算机应用中文信息处理语音识别模型自适应
- 面向语音识别错误恢复的澄清式人机对话系统
- 2011年
- 在人机交互系统中,自动语音识别(ASR)错误将导致交互障碍,通过发起澄清式人机对话可以实现ASR错误恢复。该文提出澄清式人机对话系统结构,用于实现语音识别错误恢复,实现了系统的4个组成部分:ASR错误检测、基于统计机器翻译(SMT)方法的澄清式疑问句生成模型、说话人响应分析、基于有限状态机(FSM)的对话管理模型。各模块均采用与特定任务无关的方法建立。实验结果表明:澄清式人机对话系统可以有效模拟口语中的澄清现象,在不同的错误环境中能够较好的实现ASR错误恢复任务。
- 于东贾磊徐波
- 关键词:对话管理
- 连续语音识别中声学建模的组合聚类算法研究被引量:6
- 2003年
- 基于三音子连续语音识别的一个关键问题是在有限训练数据的条件下对大量声学模型参数的鲁棒性估计。为了解决这个问题 ,有两个主要的上下文相关的聚类算法被提出 ,它们是合并 (AgglomerativeClustering)聚类 (AGG)和决策树 (Tree based)聚类 (TB)。本文分析了这两种算法的优缺点 ,并分别对其进行了改进 ,然后提出了最大似然框架下组合聚类算法。大词汇量连续语音识别 (LVCSR)的实验结果表明 ,和单一的决策树聚类算法比较 ,提出的组合聚类算法对识别率有显著的提高。
- 韩兆兵贾磊张树武徐波
- 关键词:连续语音识别声学建模