国家自然科学基金(60475007) 作品数:38 被引量:249 H指数:9 相关作者: 郭军 聂祥飞 刘刚 朱永宣 单莘 更多>> 相关机构: 北京邮电大学 重庆三峡学院 天津大学 更多>> 发文基金: 国家自然科学基金 教育部跨世纪优秀人才培养计划 教育部科学技术研究重点项目 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
应用小波变换的人脸光照补偿 被引量:16 2008年 提出了一种用于非均匀光照条件下人脸识别的光照补偿算法。该算法将人脸图像变换到对数域,并在对数域中计算二维小波变换,通过舍弃低频子带图像中的系数来实现人脸图像的非均匀光照补偿。由于人脸光照补偿是为了提高人脸识别性能,所以光照补偿的效果利用人脸识别率来表征。在Yale B人脸库中,本文方法的平均误识率可达到0.18%,比对数域离散余弦变换(DCT)光照补偿算法性能更佳;在CAS_PEAL人脸库中的实验结果表明,本文方法的性能与对数域DCT方法相近。 聂祥飞 谭泽富 郭军关键词:人脸识别 人脸光照补偿 小波变换 入侵检测系统中基于主成份分析特征提取研究 被引量:9 2006年 数据降维是基于模式识别方法的入侵检测系统需要解决的一个问题。由于主成份分析方法具有两个我们期望的特性,一是不同的主成份之间互不相关,二是每个主成份都是所有原始特征的线性组合,所以将主成份分析应用到入侵检测系统的特征提取中。首先我们使用ReliefF算法去除原始特征中与分类无关的特征,然后再进行主成份分析。在实际的数据集KDDCUP’99上进行的实验结果表明提出的方法是有效及实用的。 朱永宣 单莘 郭军关键词:入侵检测系统 特征提取 主成份分析 基于贝叶斯分类器的混排文字切分与分类 被引量:6 2005年 该文针对实际的混排文档图像,提出一种基于贝叶斯分类器的统计学习方法切分文字,并实现文字类别判断。该方法结构简单、计算量少、易于扩展功能,而且试验结果表明该方法切分效果好、文字类别判断准确。 肖波 徐蔚然关键词:文字切分 文字识别 基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统 被引量:22 2006年 本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统。介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数的选取,讨论了分类系统的若干重要问题,研究了训练集的规模和质量对分类系统的影响。根据863计划文本分类测评组所提供的测试标准、训练集以及测试集对本文所设计的分类系统进行测试,实验结果表明该分类系统有良好的分类效果。 毛伟 徐蔚然 郭军关键词:计算机应用 中文信息处理 中文文本分类 N-GRAM语言模型 基于广义置信度的样本选择算法 被引量:5 2007年 对模式识别系统而言,不同的训练样本在建立模式类模型时所起的作用不同,因此必须对训练样本进行选择。而在训练样本中,边界样本的判定方式以及训练样本中包含边界样本数量的多少对分类的精度起主要作用。为此,结合基于模板匹配的脱机手写汉字识别,定义了一种通过广义置信度判定边界样本的方法,并且在此基础上建立了基于广义置信度的训练样本选择算法。通过在脱机手写汉字数据库HCL2004上进行实验,由该算法选择出的训练样本集在训练样本数减少的同时,使得系统识别率有了较大的提高,从而证实了该算法的有效性。 任俊玲关键词:人工智能 模式识别 手写汉字识别 入侵检测系统中基于PCA和C-SSGA的双向数据压缩 被引量:2 2009年 针对入侵检测数据中的冗余特征和冗余实例,提出一种基于主成分分析和混合稳态遗传算法的双向数据压缩方法.利用主成分分析对特征进行压缩,有效地去除特征之间的冗余性;用混合稳态遗传算法进行实例压缩,大大缩减了实例的数量;提出一个基于神经网络的入侵检测系统模型,该模型具有多分类、易于更新系统及快速适应新型入侵的特点.在KDD CUP’99上的实验表明,提出的方法是有效的,可以用于处理大数据集的压缩问题. 朱永宣 单莘 郭军关键词:入侵检测系统 主成分分析 神经网络 入侵检测系统中基于变量相似性特征选择 被引量:3 2005年 ReliefF是一种在很多场合经常使用的filter式的特征选择方法,然而该方法的一大缺点是不能辨别冗余特征。基于ReliefF算法提出一种混合的有监督的特征选择算法。该算法首先利用ReliefF算法去除与分类无关的以及权重低于一定阈值的特征,然后采用一种变量相似性准则来去除冗余特征。在实际的数据集KDDCUP蒺99上进行的实验结果表明该混合特征选择方法较单独使用ReliefF方法在分类精度上有一定的提高。 朱永宣 单莘 郭军关键词:入侵检测系统 RELIEFF算法 汉语大词汇量连续语音识别中混淆网络算法的研究 被引量:1 2007年 在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。 吴斌 刘刚 郭军关键词:混淆网络 语音识别 小波包变换在人脸识别光照补偿中的应用 被引量:4 2008年 提出了一种用于非均匀光照条件下人脸识别的光照补偿算法。该算法首先将人脸图像变换到对数域,并在对数域中计算2维小波包变换,通过舍弃部分子带图像中的系数来实现人脸图像的非均匀光照补偿。由于人脸光照补偿的目的是为了提高人脸识别性能,所以光照补偿的效果利用人脸识别率来表征。在YaleB人脸库中,与对数域离散余弦变换(DCT)光照补偿算法进行了比较,实验结果表明,本文方法的人脸识别平均误识率可以达到0.53%,比对数域DCT方法具有更好的性能。 聂祥飞 谭泽富 郭军关键词:人脸识别 人脸光照补偿 小波包变换 对数域 基于说话人聚类的说话人自适应 2007年 本文提出一种改进的基于模型差别度量的说话人聚类(Speaker Clustering)方法,并将该说话人聚类算法结合最大似然线性回归算法(Maximum Likelihood Linear Regression,MLLR)构成整体的说话人自适应框架。将该方法应用于以音素为识别基元的汉语连续语音识别系统中,可能够提高系统的识别率,较好的满足快速性和渐进性。实验结果表明,该方法能够在仅有一句自适应数据的情况下,使系统字正识率由40.43%提高到50.86%. 王坚关键词:说话人聚类 说话人自适应