屈丹
- 作品数:105 被引量:279H指数:9
- 供职机构:中国人民解放军信息工程大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划河南省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术军事理学更多>>
- 基于类内方差归一化和SVM的说话人识别方法被引量:5
- 2009年
- 支持向量机(SVM)由于其强大的分类能力,引起人们广泛的重视,并且成功地应用于说话人识别。其中基于GLDS核的SVM系统性能比较优异。引入类内方差归一化(WCCN)方法来处理SVM的输入特征向量,并和GLDS核相结合,提出一种基于类内方差归一化和SVM的说话人识别方法。该方法利用WCCN方法对SVM的输入特征向量进行变换,增强特征向量的类间区分能力,再采用GLDS核函数进行SVM的训练,以提高SVM的分类效果。实验表明,新方法是有效的,其性能优于基于GLDS核的SVM系统。
- 高新建李弼程屈丹
- 关键词:支持向量机
- 采用逼近优化的提升大边距估计准则
- 2013年
- 针对大边距估计(Large Margin Estimation,LME)准则仅选取支持集内的最小边距进行调整导致边距利用不合理的问题,本文提出一种大边距准则目标函数的改进形式,通过增强竞争假设中与正确标注竞争关系较强的路径的似然得分,使训练数据的分类边距在一定程度上变小,从而进一步提高大边距估计的训练效果。并在此基础上,提出一种新的逼近优化方法,即当某点目标函数与辅助函数梯度方向相同时,在该点邻近的一定范围内,优化辅助函数即可带来目标函数相应的优化。在微软语料库上的实验成功证明了本文算法的有效性。
- 徐双印屈丹
- 关键词:辅助函数
- 特征增强的单阶段遥感图像目标检测算法
- 2022年
- 针对遥感图像目标检测算法在特征融合过程中最高层信息丢失及遥感图像复杂背景难以区分的问题,提出了一个特征增强的单阶段遥感图像目标检测算法。该算法在基线单阶段对齐网络(S2A-Net)中引入残差特征增强处理策略和改进的通道注意力机制,从而保留特征融合过程中最高层信息并使网络抑制复杂背景信息。为了验证所提算法的有效性,分别在DOTA-v1.0数据集和HRSC2016数据集上进行了实验。实验结果表明,所提算法相比于S2A-Net算法,在DOTA-v1.0数据集上的平均精度提升了1.43个百分点,并在HRSC2016数据集上取得了比较有竞争力的结果。
- 杨旭屈丹司念文柳聪
- 关键词:遥感图像目标检测注意力
- 语音识别中的双线性时频分布技术被引量:3
- 2005年
- 简单介绍了对语音识别中具有高时频分辨率优势的双线性时频分布技术,并对此技术的应用做了简单展望。
- 张强屈丹王炳锡
- 关键词:核函数
- VoIP压缩码流说话人识别研究被引量:2
- 2009年
- 研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
- 唐晖李弼程屈丹张连海
- 关键词:说话人识别
- 声学模型区分性训练中的动态加权数据选取方法
- 2014年
- 提出了一种基于动态加权的数据选取方法,并应用到连续语音识别的声学模型区分性训练中.该方法联合后验概率和音素准确率选取数据,首先,采用后验概率的Beam算法裁剪词图,在此基础上依据候选词所在候选路径的错误率,基于后验概率动态的赋予候选词不同的权值;其次,通过统计音素对之间的混淆程度,给易混淆音素对动态地加以不同的惩罚权重,计算音素准确率;最后,在估计得到弧段期望准确率分布的基础上,采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明,与最小音素错误准则相比,该动态加权方法识别准确率提高了0.61%,可有效减少训练时间.
- 陈斌牛铜张连海李弼程屈丹
- 关键词:语音识别动态加权
- 基于GMM区分性训练方法的语言辨识系统被引量:6
- 2004年
- 文章给出了一种新的语言辨识系统,该系统基于高斯混合模型的区分性训练算法。该区分训练算法在估计模型参数时,采用了广义概率下降法(GPD)和最小分类误差准则(MCE)。利用OGI多语言电话语料库对算法进行了测试,实验表明,该算法是进行语言辨识的一种有效方法。
- 屈丹王炳锡藏传辉
- 关键词:高斯混合模型
- 基于Seneff听觉谱特征的汉语连续语音声韵母边界检测被引量:6
- 2012年
- 提出了一种基于声韵母能量分布和共振峰结构特性的汉语连续语音声韵母边界检测方法。该方法首先将语音经过Seneff听觉感知模型得到听觉谱,然后基于听觉谱,选取全频带能量、低频带能量、谱重心、高低频能量比、中高频能量等特征参数对各声韵母类别能量分布和共振峰结构特性进行描述,最后根据特征参数变化剧烈的点确定出声韵母边界,并采用包络的一阶差分和基于样点的Kullback-Leibler距离对得到的边界进行修正。实验结果表明,对8 kHz采样的语音边界检测准确率可达到93.7%;信噪比10dB的语音边界检测准确率可达到85.3%以上;经过参数编码后语音边界检测准确率可达86 7%以上。
- 陈斌张连海王波屈丹
- 关键词:汉语连续语音谱特征韵母结构特性
- 基于子词PSPL的汉语语音文档索引
- 2013年
- 针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
- 陆明明张连海屈丹
- 关键词:词格
- 汉语音节混淆网络的生成与重打分算法研究
- 2012年
- 针对目前混淆网络生成算法速度与精度不能兼顾的不足,提出一种新的汉语音节混淆网络生成的方法.本算法采用类似轴对齐算法,对音节网格每次提取一条局部路径与参考路径对齐,根据每次对齐路径与参考路径长度不同,采用不同的策略生成混淆网络,并在生成混淆网络之后对其应用一种新的解码框架进行重打分.实验表明,该算法生成的混淆网络精度较高,时间复杂度优于轴对齐算法,且重打分后的识别率有显著提高.
- 尹明明李弼程屈丹牛铜
- 关键词:混淆网络语音识别