黄志华
- 作品数:26 被引量:22H指数:3
- 供职机构:新疆大学更多>>
- 发文基金:国家自然科学基金新疆维吾尔自治区自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学理学更多>>
- 基于改进的TransT算法的单目标跟踪无人机
- 本发明提供一种基于改进的TransT算法的单目标跟踪无人机方法,所述方法包括以下步骤:步骤1:将无人机仅占据每个图像的不到1%区域的数据分为训练集和测试集。步骤2:构建基于改进TransT的无人机目标跟踪模型(Trans...
- 黄志华 翟贤旭李涛
- 基于时域的基频感知语音分离方法被引量:2
- 2022年
- 传统的单通道语音分离方法主要采用混音作为输入,对其进行分离得到目标说话人的语音.最近的研究表明,将预估计的基频信息注入到原始混音信号中能够提高分离效果,但这种方法最初应用于时频域.近年来,基于时域的语音分离方法已经被验证优于早期的时频域分离方法.基于上述出发点,本文提出基于辅助基频的时域语音分离方法.该方法首先将时域信号输入预分离模块生成预分离语音,并从预分离语音中提取基频;然后将提取的基频与原始混音拼接,作为后分离模块的输入进行第二次分离.本文评估了不同的基频提取方法和训练策略.语音分离实验结果表明:在训练后分离模块时,先使用理想基频与混音融合训练一个理想分离网络,然后用RAPT方法对预分离源提取估计基频注入混音,再进行理想分离网络的微调,能够获得最佳的语音分离性能,比Conv-TasNet基线方法提高了0.5 dB.这说明显式地注入辅助基频信息不仅在时频域语音分离中表现出了有效性,同时也适用于时域语音分离.
- 王凯李鸣鹤黄志华黄浩
- 关键词:语音分离单通道基频时域
- 一种基于瓶颈特征和残差网络的语音关键词检索方法
- 本发明公开了一种基于瓶颈特征和残差神经网络的语音关键词检索的方法,所述方法包括以下步骤:步骤1:预处理数据:对训练数据预处理,利用预训练前馈网络得到数据集的瓶颈特征,再生成相似矩阵图像;步骤2:模型训练:构建语音关键词检...
- 王大飞黄志华刘文臣
- 一种基于用户行为的P2P模型被引量:1
- 2011年
- 为研究用户行为与P2P系统的相互作用,提出一种P2P文件共享系统的数学模型。将系统引导策略引入P2P用户行为建模,综合考虑用户下载文件前后的行为特征,分析引导策略对用户行为和系统性能的影响,比较3种引导策略的效果。仿真结果表明,系统引导能有效提高用户首次选择高质量文件下载的概率,减少重新下载的次数和下载总流量。
- 黄志华陆松年
- 关键词:P2P文件共享用户行为重审
- 基于规格说明的测试用例生成方法及其在实时嵌入式软件测试中的应用
- 本文主要对面向对象软件中基于规格说明的测试用例生成方法进行研究,目的是在软件开发的早期能够同步地生成独立于代码设计的高层测试用例,从而进一步提高软件的生产效率和软件产品的质量,同时还讨论了实时嵌入式软件的实时性测试方法。...
- 黄志华
- 关键词:实时嵌入式系统软件测试面向对象软件开发
- 文献传递
- 基于噪声稀疏特性的语音增强算法分析
- <正>0引言语音在采集和传递过程中不可避免会受到周围环境噪声的干扰,噪声过大时会严重影响语音质量,语音增强就是对含噪信号进行去噪处理,同时保持语音信号不失真,达到提高语音质量和可懂度的目的。传统语音增强技术的效果依赖于对...
- 黄志华黄浩胡英于迎霞
- 关键词:语音增强环境噪声压缩感知
- 文献传递
- 本科和研究生数字图像处理课程的差异化教学思考被引量:7
- 2019年
- 以本校本科和硕士研究生数字图像处理课程情况的比较分析为起点,分析国内一些双一流建设高校数字图像处理系列课程的开设情况,从授课教师选择、授课内容侧重、教学模式及环节设计、课程体系建设、考核方式等方面进行探讨,提出需从培养方案侧重,数字图像处理课程本身特点,知识建构模式不同层次需求入手,设计并构建该课程本科和硕士研究生的差异化教学体系。
- 于迎霞库尔班.吾布力古丽拉.阿东别克黄志华
- 关键词:数字图像处理本科差异化教学图像工程
- 一种基于多任务去噪扩散隐模型的语码转换语音合成方法
- 本发明属于信息处理技术领域,提供了一种基于多任务去噪扩散隐模型的语码转换语音合成方法,训练使用的公共数据集为Data Baker和LJSpeech;首先,我们在LJSpeech数据集上对扩散参数化进行了初步分析,根据实验...
- 黄志华 陈可 颜永红
- 一种基于深度压缩感知的语音增强方法
- 本发明公开了一种基于深度压缩感知的语音增强方法,所述方法包括以下步骤:步骤1:预处理训练数据,获取时域语音信号序列;步骤2:构建基于深度压缩感知的语音增强模型(SEDCS),并对其进行联合训练;步骤3:预处理带噪语音测试...
- 康峥黄志华赖惠成
- 针对口音识别中冗余特征及长尾效应的有效方法
- 2024年
- 口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。通过模型自适应学习通道和空间维度的不同权重,提高了口音识别的性能。在Common Voice英语口音数据集上的实验结果表明,引入CBAM注意力模块是有效的,识别准确率相对提升了12.7%,精确度相对提升了17.9%,F1值相对提升了6.98%。之后,提出了一种树形分类方法来缓解数据集中的长尾效应,识别准确率最多相对提升了5.2%。受域对抗训练的启发,尝试通过对抗学习方法剔除口音特征中的冗余信息,使得准确率最多相对提升了3.4%,召回率最多相对提升了16.9%。
- 杨壮颜永红黄志华