刘晓星
- 作品数:12 被引量:4H指数:1
- 供职机构:中国科学院声学研究所更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 电话语音识别中的自适应方法
- 本发明涉及一种电话语音识别中的自适应方法,包括,预处理过程和自适应更新过程;所述预处理过程是根据采集的多个说话人样本数据的性别、口音、年龄特征形成一个决策树,该决策树的每个叶节点中记录一个语音类的高斯混合模型、隐马尔科夫...
- 刘晓星韩疆潘接林颜永红
- 文献传递
- 一种基于距离测算和贝叶斯信息判据的音频分段算法
- 本文提出的分段算法先使用距离测算的方法将音频流分为较为零碎的片段,再利用贝叶斯信息判据(BIC)对相邻的片段进行合并,力图使每一个音频片段中仅含有单一的声学特征.此算法在广播新闻语料和访谈性质的电话交谈中均取得了较好的效...
- 徐燃刘晓星潘接林
- 关键词:语音信号处理
- 文献传递
- 一种任务域无关的语音关键词检测系统被引量:4
- 2006年
- 提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜索空间构造方法,关键词识别准确率平均提高了绝对6.9%;提出了近邻声学上下文准则以及候选关键词在多尺度声学模型上的似然比计算方法并采用FLDA融合,显著提高了声学置信度计算的有效性,系统等错率绝对下降了3.0%。
- 韩疆刘晓星颜永红张鹏远
- 关键词:搜索空间
- 一种基于距离测算和贝叶斯信息判据的音频分段算法
- 音频流分段技术在语音识别的前端信号处理过程中有着重要的意义。好的音频分段算法应能根据说话人、信道等声学环境的变化对输入音频流进行分段,从而为后续的聚类和自适应过程做好准备。本文提出的分段算法先使用距离测算的方法将音频流分...
- 徐燃刘晓星潘接林
- 关键词:声学特征
- 文献传递
- 基于音频流的电视智能监测系统设计
- 2005年
- 广电总局的电视监测业务已经实现了设备控制自动化和卫星信号采集的数字化、信息化和网络化,但基于内容的异态事件监测和信息处理还是完全依赖人工完成。语音处理、语音识别和关联检索等技术的发展,为电视监测业务智能化提供了可能。本文介绍了电视监测业务智能辅助系统的架构,该系统能够自动定位电视节目,把电视新闻语音转化为文字,对敏感语言内容预警,并关联聚类相关信息,方便人工后续处理。
- 崔朝阳刘晓星韩疆颜永红
- 关键词:语音识别说话人识别
- 基于高斯混合模型的说话人跟踪系统
- 当前说话人跟踪技术在国家信息安全,如电话监控, 互联网监控,以及电信增值业务中得到了广泛的关注。说话人跟踪系统目的在于将目标说话人在一段语音数据中进行定位。本文介绍一个应用于互联网监控的说话人跟踪系统, 本系统基于高斯混...
- 索宏彬刘晓星
- 关键词:说话人跟踪
- 文献传递
- 一种任务域无关的语音关键词检测系统
- 本文介绍一种与任务域无关的语音关键词检测系统,面向实际应用需求,该系统的关键词表可即时配置、即时使用。本文首先描述一种语音关键词检测的多尺度声学模型建模方法,在此基础之上,给出一种高效搜索空间构造方法,实验表明可显著提高...
- 韩疆刘晓星颜永红张鹏远潘接林
- 关键词:声学建模测量方法
- 文献传递
- 一种任务域无关的语音关键词检测系统
- 本文介绍一种与任务域无关的语音关键词检测系统,面向实际应用需求,该系统的关键词表可即时配置、即时使用。本文首先描述一种语音关键词检测的多尺度声学模型建模方法,在此基础之上,给出一种高效搜索空间构造方法,实验表明可显著提高...
- 韩疆刘晓星颜永红张鹏远潘接林
- 关键词:搜索空间
- 文献传递
- 互联网音频智能检索系统设计
- 语音处理、语音识别和关联检索等技术的发展,为互联网音频检索业务的智能化提供了可能。本文介绍了互联网音频智能检索系统的架构,该系统能够在互联网上的海量音频数据中自动定位固定音频,对目标语言内容和目标说话人检测,把重点检索的...
- 刘晓星韩疆邵建颜永红
- 关键词:语音识别说话人识别关键词检测
- 文献传递
- 互联网音频智能检索系统设计
- 语音处理、语音识别和关联检索等技术的发展,为互联网音频检索业务的智能化提供了可能。本文介绍了互联网音频智能检索系统的架构,该系统能够在互联网上的海量音频数据中自动定位固定音频,对目标语言内容和目标说话人检测,把重点检索的...
- 刘晓星韩疆邵建颜永红
- 关键词:多媒体检索系统设计
- 文献传递