郭宇弘
- 作品数:2 被引量:11H指数:2
- 供职机构:中国科学院更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 用于版权管理的数字音频水印算法被引量:7
- 2011年
- 该文提出了一种用于多媒体资料版权管理的自同步音频盲水印算法。由于版权应用需要通过解码结果得到素材的使用情况,对解码结果时间精度有一定要求,同时对鲁棒性和不可感知性要求也较高。针对之前算法存在鲁棒性不够,时间精度低的问题。该文提出的算法利用扩频的方法和音频信号的短时相关的特性提高嵌入水印的鲁棒性的同时,通过心理声学模型的应用改善算法的不可感知性。算法通过合理设计了水印信息帧结构和同步策略提高了解码结果的时间精度。实验结果表明,该文的方法在具有很高不可感知性的情况下,能够有效地抵抗各种常见的音频编辑操作。
- 赵学敏郭宇弘邹学强刘建颜永红
- 关键词:数字水印心理声学扩频版权保护
- 基于加权有限状态机的动态匹配词图生成算法被引量:4
- 2014年
- 由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
- 郭宇弘黎塔肖业鸣潘接林颜永红
- 关键词:自动语音识别关键词检索