国家高技术研究发展计划(2007AA01Z157)
- 作品数:5 被引量:37H指数:4
- 相关作者:陈一宁罗全锋郑翔翔张怡陈晓光更多>>
- 相关机构:上海交通大学更多>>
- 发文基金:国家高技术研究发展计划上海市科学技术委员会科研基金更多>>
- 相关领域:自动化与计算机技术电子电信农业科学更多>>
- 基于麦克风阵列的实时声源定位被引量:10
- 2010年
- 由于噪音和多路的存在,声源定位总是很难达到一个很高的精度。针对这个问题提出了一个在智能教室环境下使用麦克风阵列对声源位置进行实时估计的算法,该算法分为三个阶段——去除噪音、延时估计和空间定位,即首先通过一个滤波器来对语音信号中噪音进行预处理,然后通过一个改进的GCC-PHAT算法来对多路语音信号的时延进行估计,最后通过构建几何关系来估计声源的位置。实验结果表明,在有一定噪音的自然教室环境下,算法的平均定位精度能够控制在5 cm以内,具有很强的应用性。
- 刘真旭
- 关键词:声源定位麦克风阵列延时估计去噪
- 语音识别在英语发音纠错中的应用被引量:4
- 2011年
- 主要研究如何更好地让计算机智能地纠正英语学习者的发音错误。借助语音识别中的HMM(隐马尔可夫模型)建模方法,用Viterbi算法和改进的后验概率算法对中国学习者的英语发音进行自动识别,通过对基本单元进行切分和评分,最后,为英语学习者提供可信度比较高的发音信息反馈,纠正发音错误。
- 张锋陈一宁罗全锋
- 关键词:隐马尔可夫模型语音识别
- 基于头部检测和跟踪的人数统计方法被引量:13
- 2011年
- 提出一种基于头部检测和跟踪的人数统计方法。方法利用Adaboost算法进行头部检测,将头部检测分成了头顶检测、侧面检测、正面检测和后脑勺检测等多个子检测过程。此外,利用图像特征直方图的信息进行头部跟踪,排除了对静态误检目标的统计,提高了检测的精度。实验结果验证了该方法的有效性。
- 郑翔翔张怡
- 关键词:ADABOOST算法类HAAR特征人数统计
- 一种基于多通道信息融合的教师运动跟踪方法
- 2010年
- 提出一种基于多通道信息融合的教师运动跟踪方法。该方法改进了传统的运动人像检测算法,能进行多目标的识别与跟踪。并结合智能教室的上下文环境信息,提出一个多通道信息融合推理算法,解决了单纯利用运动人像跟踪算法所带来的误检问题。实验表明该方法是有效的。
- 罗全锋郑红
- 关键词:智能教室
- 基于手机和人脸识别的身份识别系统被引量:10
- 2011年
- 主要研究一种以具有摄像功能的手机端和人脸识别技术为基础的身份确认系统。利用局部二元模式(LBP)直方图特征的加权卡方距离来识别用户身份的方法,并根据手机用户的拍摄场景的多变性,添加对图片的光照预处理和几何校准过程,最后达到了比较好的实用效果。同时提出利用易辨识信息减少的比对样本,大大提高了系统运行性能。最后在ELSJTU图像数据集上测试的基础上,分析总结并提出了可以改进的意见。
- 陈一宁陈晓光
- 关键词:人脸识别LBPGAMMA校正手机