广东省大学生创新实验项目(1056112028)
- 作品数:2 被引量:5H指数:1
- 相关作者:李艳雄吴伟更多>>
- 相关机构:华南理工大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家级大学生创新创业训练计划广东省大学生创新实验项目更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于语速差异的新闻发布会中首要说话人检测
- 2015年
- 新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、翻译等)语速则相对较快。基于两者的语速差异,采用一个滑动窗从连续语音流中截取语音段,再估计各音段语速得到一条语速曲线,然后寻找语速曲线中的局部最小值进而得到两类说话人的改变点,最后将语速低于门限且在两相邻改变点之间的语音段判为首要说话人语音,从而实现首要说话人检测。实验结果表明,与传统方法相比,基于语速差异的方法获得了更好的性能。
- 吴伟李艳雄王梓里陈祝允
- 关键词:说话人聚类
- 基于矢量量化的时序说话人聚类方法被引量:5
- 2014年
- 针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。
- 陈祝允李艳雄杜佳媛
- 关键词:矢量量化