西北工业大学基础研究基金(JC200943)
- 作品数:3 被引量:4H指数:1
- 相关作者:蒋冬梅王风娜吴鹏周虹辰吕兰兰更多>>
- 相关机构:布鲁塞尔自由大学西北工业大学更多>>
- 发文基金:西北工业大学基础研究基金陕西省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于发音特征的音视频融合语音识别模型被引量:2
- 2011年
- 构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性。
- 吴鹏蒋冬梅王风娜Hichem SAHLIWerner VERHELST
- 关键词:动态贝叶斯网络发音特征语音识别异步
- 基于谐波的乐纹提取和音乐检索被引量:1
- 2012年
- 提出了一种基于节拍内音乐谐波特性的乐纹特征提取方法,首先求得每帧音乐的谐波信息,再利用跟踪得到的节拍,计算节拍内所有帧的谐波信息的均值,构成此节拍的乐纹特征矩阵。为了提高音乐检索的效率,设计了一个二级音乐检索算法:根据节拍信息,将与查询音乐片段的每分钟节拍数相近的音乐作为候选音乐,再逐节拍计算所查询音乐的乐纹和候选音乐乐纹的相似度,选择相似度最高的音乐作为检索结果。实验结果表明,提出的乐纹特征和音乐检索算法有效地提高了检索准确率和检索效率。
- 周虹辰蒋冬梅Hichem SahliWerner Verhelst
- 关键词:节拍谐波音乐检索
- 基于三流DBN模型的听视觉情感识别被引量:1
- 2012年
- 为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,在状态层同步。将面部几何特征和面部动作参数特征作为视觉输入流,与听觉输入流在状态层异步。实验结果表明,该模型优于有状态异步约束的听视觉双流DBN模型,6种情感的平均识别率从52.14%提高到63.71%。
- 吕兰兰蒋冬梅王风娜Hichem SahliWerner Verhelst
- 关键词:动态贝叶斯网络情感识别