李艳雄
- 作品数:92 被引量:109H指数:6
- 供职机构:华南理工大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金广东省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学建筑科学更多>>
- 一种基于声音事件检测的独居老人家中活动估计方法
- 本发明公开了一种基于声音事件检测的独居老人家中活动估计方法,包括下列步骤:首先,在室内放置一个拾音器阵列进行多通道音频数据的采集并对音频数据进行预处理,包括分帧与加窗;接着,从每个通道的音频数据提取对数梅尔频谱特征,从所...
- 林泽阳李艳雄沈治廷
- 文献传递
- 基于语速差异的新闻发布会中首要说话人检测
- 2015年
- 新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、翻译等)语速则相对较快。基于两者的语速差异,采用一个滑动窗从连续语音流中截取语音段,再估计各音段语速得到一条语速曲线,然后寻找语速曲线中的局部最小值进而得到两类说话人的改变点,最后将语速低于门限且在两相邻改变点之间的语音段判为首要说话人语音,从而实现首要说话人检测。实验结果表明,与传统方法相比,基于语速差异的方法获得了更好的性能。
- 吴伟李艳雄王梓里陈祝允
- 关键词:说话人聚类
- 辨识呼救声和异常脉搏的智能报警手环及其智能报警方法
- 本发明公开了一种辨识呼救声和异常脉搏的智能报警手环,包括主控模块、呼救声辨识模块、异常脉搏辨识模块、GPS定位模块、短信及现场音传送模块、基频设定模块和脉搏设定模块;本发明还公开了一种应用于辨识呼救声和异常脉搏的智能报警...
- 李艳雄张雪王琴杨超黄耀雄
- 文献传递
- 基于矢量量化的时序说话人聚类方法被引量:5
- 2014年
- 针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。
- 陈祝允李艳雄杜佳媛
- 关键词:矢量量化
- 一种基于深度音频特征的构音障碍严重程度估计方法
- 本发明公开了一种基于深度音频特征的构音障碍严重程度估计方法,包括:提取声学特征;将上述声学特征输入带瓶颈层的深度神经网络,从瓶颈层提取深度音频特征;将上述深度音频特征作为输入,采用Baum‑Welch算法训练的隐马尔可夫...
- 李鹏乾李艳雄李锦彬
- 一种基于高斯均值超矢量与谱聚类的录音设备聚类方法
- 本发明提供一种基于高斯均值超矢量与谱聚类的录音设备聚类方法,首先,从语音样本中提取刻画录音设备特性的梅尔频率倒谱系数MFCC特征;接着,将全部语音样本的MFCC特征作为输入,采用期望最大化EM算法训练一个通用背景模型UB...
- 李艳雄张雪李先苦张聿晗
- 文献传递
- 基于语音时频变换特征和整数线性规划的录音终端聚类方法
- 本发明公开了一种基于语音时频变换特征和整数线性规划的录音终端聚类方法,步骤如下:a、对读入的录音进行预处理;b、从每帧语音中提取GTCC特征;c、构造带瓶颈层的深度自编码网络并提取瓶颈特征;d、构造高斯超矢量特征;e、对...
- 李艳雄张雪张聿晗李先苦
- 文献传递
- 同时优化深度表征学习与说话人类别估计的说话人聚类方法
- 本发明公开了一种同时优化深度表征学习与说话人类别估计的说话人聚类方法,步骤如下:对聚类语音样本进行预处理,提取I‑vector特征,训练卷积自编码网络并提取深度表征特征;根据深度表征特征构造初始类,得到类别数和初始类标签...
- 李艳雄王武城刘名乐江钟杰陈昊
- 基于音频特征空间分层描述的音频分类方法
- 本发明公开一种基于音频特征空间分层描述的音频分类方法,步骤为:通过考察各音频类型GMM模型高斯空间分布之间的重叠程度,将重叠度大的不同类型的高斯分布进行合并,构建音频特征空间描述子;音频类型对区分子模型:根据音频特征空间...
- 贺前华汪星庞文丰李艳雄
- 文献传递
- 基于偏好排序淘汰NSGAII算法的短波网络多区域重点覆盖优化方法被引量:6
- 2017年
- 在采用偏好NSGAII算法求解多子区域重点覆盖的短波网络频率优化指配时,针对算法中非支配排序耗时较多的问题,该文提出一种偏好排序淘汰的NSGAII算法。在进行非支配排序前,根据解的偏好评价排序结果淘汰一部分偏好评价较差的解,减少参与非支配排序的解的数量从而减少求解时间,同时降低偏好评价结果较差的个体解被选中进行交叉、变异的概率,提高算法的求解效率和求解效果。在进行的48组数据测试中,该文算法在其中38组决策解偏好评价结果和求解时间同时最优,相同迭代次数时相比偏好NSGAII算法节省27%的求解时间。结果表明通过偏好排序淘汰机制的引入,更好利用了偏好信息,使算法用较少的时间求得更好的偏好解。
- 李新超贺前华李艳雄朱铮宇
- 关键词:频率指配多目标优化