您的位置: 专家智库 > >

郭宇弘

作品数:2 被引量:11H指数:2
供职机构:中国科学院更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇心理声学
  • 1篇音频水印
  • 1篇音频水印算法
  • 1篇有限状态机
  • 1篇语音
  • 1篇语音识别
  • 1篇数字水印
  • 1篇数字音频水印
  • 1篇数字音频水印...
  • 1篇水印
  • 1篇水印算法
  • 1篇状态机
  • 1篇自动语音识别
  • 1篇扩频
  • 1篇加权
  • 1篇关键词检索
  • 1篇版权
  • 1篇版权保护
  • 1篇版权管理
  • 1篇词图

机构

  • 2篇中国科学院

作者

  • 2篇郭宇弘
  • 2篇颜永红
  • 1篇潘接林
  • 1篇邹学强
  • 1篇刘建
  • 1篇赵学敏

传媒

  • 2篇电子与信息学...

年份

  • 1篇2014
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
用于版权管理的数字音频水印算法被引量:7
2011年
该文提出了一种用于多媒体资料版权管理的自同步音频盲水印算法。由于版权应用需要通过解码结果得到素材的使用情况,对解码结果时间精度有一定要求,同时对鲁棒性和不可感知性要求也较高。针对之前算法存在鲁棒性不够,时间精度低的问题。该文提出的算法利用扩频的方法和音频信号的短时相关的特性提高嵌入水印的鲁棒性的同时,通过心理声学模型的应用改善算法的不可感知性。算法通过合理设计了水印信息帧结构和同步策略提高了解码结果的时间精度。实验结果表明,该文的方法在具有很高不可感知性的情况下,能够有效地抵抗各种常见的音频编辑操作。
赵学敏郭宇弘邹学强刘建颜永红
关键词:数字水印心理声学扩频版权保护
基于加权有限状态机的动态匹配词图生成算法被引量:4
2014年
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
郭宇弘黎塔肖业鸣潘接林颜永红
关键词:自动语音识别关键词检索
共1页<1>
聚类工具0