梁山
- 作品数:20 被引量:93H指数:3
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学更多>>
- 篡改音频的检测方法、装置及存储介质
- 本公开涉及一种篡改音频的检测方法、装置及存储介质,上述方法包括:获取待检测信号,并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分;分别对所述低频成分和所述高频成分进行离散小波变换,并计算经过所述离散...
- 梁山陶建华聂帅易江燕
- 文献传递
- 篡改音频的检测方法、装置及存储介质
- 本公开涉及一种篡改音频的检测方法、装置及存储介质,上述方法包括:获取待检测信号,并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分;分别对所述低频成分和所述高频成分进行离散小波变换,并计算经过所述离散...
- 梁山陶建华聂帅易江燕
- 文献传递
- 篡改音频的检测方法、装置、电子设备及存储介质
- 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测信号,并对待检测信号进行第一预设阶数的小波变换,得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数;对阶数大于等于第二...
- 梁山陶建华聂帅易江燕
- 文献传递
- 生成语音的检测方法、装置、电子设备及存储介质
- 本公开涉及一种生成语音的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测语音,并提取所述待检测语音的第一声学特征和第二声学特征;将所述第一声学特征输入语音识别模型,输出所述第一声学特征对应的文本序列;分别通过...
- 易江燕陶建华傅睿博聂帅梁山
- 麦克风阵列语音增强的方法、装置、电子设备及存储介质
- 本申请涉及一种麦克风阵列语音增强的方法、装置、电子设备及存储介质,所述方法包括:通过麦克风阵列获取已知声源方向的待增强语音信号;提取所述待增强语音信号的频谱特征和方向相干特征;将所述待增强语音信号的频谱特征和方向相干特征...
- 聂帅梁山陶建华易江燕
- 文献传递
- 一种骨传麦克风语音增强方法及装置、设备及存储介质
- 本公开涉及一种骨传麦克风语音增强方法及装置、设备及存储介质,所述方法包括:获取两种频域信号,并根据预设的截止频率,对所述两种频域信号分别进行截取,得到两种截取后频域信号;对所述两种截取后频域信号分别进行半波整流,得到两种...
- 梁山陶建华聂帅李冠君易江燕
- 基于噪声追踪的二值时频掩蔽到浮值掩蔽的泛化算法被引量:5
- 2013年
- 虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩蔽的泛化算法。由于实现浮值掩蔽估计的关键在于噪声能量追踪,我们首先采用指数分布刻画以混合谱和噪声能量以混合能量及二值掩蔽为观测的条件分布。其次,采用高斯马尔柯夫条件随机场刻画噪声估计在连续几帧内的关联。最后,采用马尔柯夫链-蒙特卡洛计算噪声能量最小均方误差估计并进一步计算浮值掩蔽。实验表明,相比于基于二值掩蔽估计的常规算法,我们所提出的算法在信噪比增益和客观感知质量两方面都有显著提高。
- 梁山刘文举江巍
- 关键词:噪声估计最小均方误差估计时频
- 一种语音鉴伪与说话人识别联合建模的方法
- 本发明提供一种语音鉴伪与说话人识别联合建模的方法及系统,其中方法包括:前端信号处理:把训练数据通过信号重采样统一到一个固定采样率,得到信号处理后的训练数据;特征提取:对信号处理后的训练数据的每帧信号提取Fbank特征;表...
- 聂帅陶建华梁山易江燕傅睿博
- 文献传递
- 基于双谱加权空间相关矩阵的语音声源定位方法
- 针对实际复杂噪声环境下基于麦克风阵列的鲁棒语音声源定位问题,本发明利用双谱域上麦克风阵列所接收的语音信号及噪声信号的特殊数学性质,提供了一种基于双谱加权空间相关矩阵的语音声源定位方法,包括:对麦克风阵列采集到的信号进行分...
- 刘文举雪巍梁山
- 文献传递
- 基于深度学习语音分离技术的研究现状与进展被引量:72
- 2016年
- 现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望.
- 刘文举聂帅梁山张学良
- 关键词:神经网络语音分离计算听觉场景分析