罗骏
- 作品数:8 被引量:20H指数:3
- 供职机构:清华大学信息科学技术学院电子工程系更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种高效的语音关键词检索系统
- 本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的日的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆...
- 罗骏欧智坚
- 关键词:语音数据关键词检索
- 文献传递
- 一种高效的语音关键词检索系统被引量:12
- 2006年
- 针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图,在这一过程中通过若干次的无监督最大似然线性回归自适应算法渐次提高拼音图的质量。检索阶段响应用户的频繁查询,只需在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统具有较高的召回率和正确率,且检索阶段仅需0.01倍实时,可以满足快速检索的需要。
- 罗骏欧智坚
- 关键词:信息检索关键词检索置信度
- 一种高效的语音关键词检索系统
- 本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆...
- 罗骏欧智坚
- 关键词:信息检索关键词检索置信度
- 文献传递
- 基于相关子空间本征音分析的MAP快速自适应被引量:3
- 2004年
- 本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最大似然准则的做法 ,该算法用最大后验准则以更好地估计参数。实验证明 ,在仅有 1句自适应数据的情况下它即能取得 6 .4 5 %的相对误识率下降 ,自适应速度远快于传统的最大后验方法 ,也不存在最大似然线性回归方法在极少数据量情况下反而造成系统识别性能下降的现象。结果表明该方法并不明显依赖相关子空间的划分数量 。
- 罗骏欧智坚王作英
- 关键词:信息处理语音识别快速自适应最大似然
- 基于拼音图的两阶段关键词检索系统被引量:1
- 2005年
- 针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健检索的需要。两阶段分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图。检索阶段响应用户的频繁查询,在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统的二字词召回率及正确率可达72.19%和72.68%,三字词召回率及正确率可达73.51%和82.98%,均优于LVCSR系统,且检索阶段仅需0.01倍实时,具有良好的实用价值。
- 罗骏欧智坚王作英
- 关键词:信息检索关键词检索置信度
- 多功能语音/音频信息检索系统的研究与实现
- 语音/音频是一种重要的信息载体。本文描述了如何综合运用语音识别、说话人识别等技术,实现一个多功能语音/音频信息检索系统,能够从语音/音频库中检索(searching)出感兴趣的信息。感兴趣的语音/音频信息呈现出不同的形式...
- 欧智坚罗骏谢达东赵贤宇林晖王作英
- 关键词:信息检索关键词检测
- 文献传递
- 多功能语音/音频信息检索系统的研究与实现
- 语音/音频是一种重要的信息载体.本文描述了如何综合运用语音识别、说话人识别等技术,实现一个多功能语音/音频信息检索系统,能够从语音/音频库中检索(searching)出感兴趣的信息.感兴趣的语音/音频信息呈现出不同的形式...
- 欧智坚罗骏谢达东赵贤宇林晖王作英
- 关键词:信息检索关键词检测
- 文献传递
- 说话人自适应训练方法在连续语音识别中的应用被引量:4
- 2004年
- 自适应技术在近年来得到越来越多的重视 ,其中应用广泛的包括MAP、MLLR ,该技术利用少量特定人数据就可以调整码本 ,快速地提升识别性能 ,它要求原始的码本有很好的说话人无关性。本文介绍了结合MLLR自适应的说话人自适应训练 (SpeakerAdaptiveTraining ,以下简称SAT)算法 ,这种方法将每个说话人码本视为说话人无关码本经过线性变换的结果 ,在此基础上训练的说话人无关码本更有效剔除了说话人相关信息 ,因此在说话人自适应中时能根据特定数据调整更好地逼近说话人特性 ,从而有更好的性能表现。
- 罗骏欧智坚王作英
- 关键词:计算机应用中文信息处理自适应SAT