钱学明
- 作品数:59 被引量:26H指数:3
- 供职机构:西安交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信交通运输工程文化科学更多>>
- 基于GA的压缩域中全局运动估计及在字幕遮挡区域恢复中的应用被引量:2
- 2006年
- 文章提出了一种直接使用压缩域中的运动矢量进行全局运动估计的方法,并用遗传算法优化输入运动矢量与全局运动参数所产生运动矢量的平均匹配误差.最终的实验结果表明本文的方法能够很好的估计出全局运动的参数.并且提出了一种运用全局/局部运动信息进行视频中字幕遮挡区域的恢复的方法.实验结果表明该方法取得了较好的视觉效果.
- 钱学明刘贵忠
- 关键词:全局运动估计字幕运动矢量遗传算法
- 一种基于细粒度识别的菜品及属性信息的识别系统及方法
- 本发明公开一种基于细粒度识别的菜品及属性信息的识别系统及方法,包括:对待识别的菜品图像进行预处理;将预处理后的图像输入训预先练好的深度神经网络菜品分类与属性识别器进行识别,输出菜品的类别属性信息;将获得获得菜品的类别属性...
- 钱学明刘成旭
- 文献传递
- 一种可视化的网络用户多媒体管理方法
- 本发明公开了一种可视化的网络用户多媒体管理方法,区别于现有仅以不同文件夹存放、管理多媒体数据的方法,其特征在于:对于用户已上传的图片、音频、视频和文档,本发明根据图片自带GPS与时间信息,在地图上生成旅游路线,并可在电脑...
- 蒋舒卉钱学明蓝可李靖李凡
- 文献传递
- 一种重要区域重采样的人脸检索方法
- 2012年
- 针对人脸中不同部位对检索和识别的区分力度的影响问题,提出了一种基于重要区域重采样的人脸检索方法.该方法不仅继承了图像分块后的特征提取保留局部信息的优点,而且只需对人脸中最重要的部位进行重采样,即以一定采样步长移动采样小块,密集采集重要区域,并以指定距离交叠其他小块,从而避免了均匀分块对重要区域划分不当而丧失判别力的问题,进而降低了识别复杂度,提高了识别的抗干扰能力.在人脸检索中,所提方法实现了重要区域的加权处理,与现有均匀分块方法相比,在计算复杂度增加不大的情况下大大提高了人脸的识别能力.大量的对比实验验证了所提方法的优越性.
- 蒋舒卉钱学明
- 关键词:人脸检索特征提取
- 一种以图快速检索景点的方法及导游系统
- 本发明公开了一种以图快速检索景点的方法及导游系统,其通过在离线系统中对大规模带有地理标签的图像数据库进行处理,从图像数据集中提取出主题相册,并通过对主题相册内容的进一步去噪,筛选,并添加文字信息最终生成离线景点数据集。并...
- 钱学明周澎
- 文献传递
- 一种获取基于H.264/AVC压缩视频字幕的方法
- 本发明公开了一种获取基于H.264/AVC压缩视频字幕的方法,包括如下步骤:执行步骤10“H.264/AVC码流解析”,从H.264/AVC压缩视频数据流中解码I帧的亮度分量图像部分解码AC系数;然后执行步骤20“熵解码...
- 钱学明刘贵忠李智王喆孙力南楠王琛汪欢
- 文献传递
- Audio Classification by Adaptive Feature Selection
- Audio information plays an important role in speaker identification and semantic based video content analysis,...
- 钱学明刘贵忠
- 文献传递
- 一种电力机车接触网受电弓电弧检测方法
- 本发明公开一种电力机车接触网受电弓电弧检测方法,包括:获取电弧图像学习样本集;Adaboost级联分类器训练;采用训练后的AdaBoost级联分类器对新获取,待识别的图像进行电弧检测;使用饱和阈值对电弧检测结果进行筛选,...
- 钱学明李巍豪侯兴松
- 一种增强网络视频中视觉重要区域清晰度的方法
- 本发明公开了一种增强网络视频中视觉重要区域清晰度的方法,其特征是,包括如下执行步骤:首先并行地执行字幕区域检测单元00和进行人脸区域检测单元01;然后执行当前帧视觉重要区域确定单元02,通过对人脸以及字幕两种重要区域进行...
- 钱学明刘贵忠李智王喆郭旦萍姜海侠王琛汪欢
- 文献传递
- 一种高效的基于H.264/AVC压缩域信息的全局运动估计方法被引量:4
- 2011年
- 本文提出了一种基于H.264/AVC压缩域的高效全局运动估计算法.由于H.264采用了多种新的视频压缩编码技术,使得其压缩码流的运动矢量(MV)场中包含大量噪声运动矢量,可参与全局运动估计的运动矢量相对较少.噪声运动矢量这里指的是与全局运动不相符的运动矢量.为了降低噪声运动矢量的影响、提高全局运动估计的精度和效率,在全局运动估计过程中就必须对噪声运动矢量进行有效的去除.本文利用H.264码流中的运动矢量预测残差(MVD)和运动矢量预测参考块的信息,对噪声运动矢量做了有效的去除.实验的结果验证了本文提出的全局运动估计算法的计算效率和精度.
- 王喆刘贵忠钱学明
- 关键词:全局运动估计运动矢量预测