国家重点基础研究发展计划(2012CB316400) 作品数:34 被引量:288 H指数:8 相关作者: 於志文 于慧敏 郭斌 钱沄涛 黄庆明 更多>> 相关机构: 浙江大学 西北工业大学 中国科学院 更多>> 发文基金: 国家重点基础研究发展计划 国家自然科学基金 陕西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 更多>>
基于商标匹配的视频广告识别 被引量:2 2012年 视频广告作为一种重要的媒体形式,正在潜移默化地影响着人们的生活。针对如何对视频广告进行识别,本文提出了一种基于商标匹配的视频广告识别算法。考虑到视频广告帧中存在着大量的背景干扰问题,本文算法首先对视频广告帧进行显著区域检测,将广告帧中较为显著的商标信息与周围背景分开,然后对已得到的显著区域图进行SURF特征提取,并与商标库中的商标显著区域图进行匹配。实验结果表明:本文算法对广告帧中商标存在的背景干扰、尺度缩放、旋转、颜色、光照等变化具有很好的鲁棒性,取得了令人满意的匹配准确率,很好地实现了视频广告识别。 张鹏雁 赵耀 朱振峰关键词:显著区域检测 基于LBSN的商业选址推荐系统的研究与实现 被引量:7 2015年 随着智能移动设备的发展和普及,空间定位技术不断成熟,基于位置的社交网络(Location-based Social Network,LBSN)得到了广泛应用。大量用户在LBSN签到,以及针对签到进行的评论不仅记录了用户的时空行为轨迹,也为研究用户行为模式和特征偏好提供了巨大的机会。提出一种基于LBSN签到数据的商业店铺选址推荐系统,首先分析用户在LBSN上的签到时间、签到地点、签到商铺类型3个方面的特征;然后提出4个影响商铺选址的因素:多样性、竞争性、相关性和客流性;最后实现商业选址推荐系统,并根据选址因素生成最优候选。并以此为基础进行相关实验来验证推荐结果,结果符合相关预期。 屈弘扬 於志文 田苗 郭斌基于零陷谱减的GSC二元麦克风小阵列语音增强算法 被引量:2 2013年 为了提高广义旁瓣抵消器语音增强算法在二元麦克风小阵列中的噪声抑制能力,提出一种基于零陷谱减二元麦克风小阵列广义旁瓣抵消器的改进语音增强算法.在广义旁瓣抵消器固定波束支路上利用谱减法抑制目标语音零陷方向噪声能量以提高其信噪比,在自适应支路使用基于动态收敛步长的快速分块最小均方自适应滤波器进一步抑制剩余噪声,以降低算法复杂度并提升自适应滤波器的收敛性.实验结果表明,相对于其他二元麦克风小阵列波束形成语音增强算法,该算法可以在任意方向获得较高质量的目标语音. 杨立春 钱沄涛 王文宏关键词:谱减法 结合排序向量SVM的视频跟踪 被引量:1 2015年 针对真实视频场景中复杂的目标外观变化问题,提出新的结合排序向量SVM(RV-SVM)的单目标视频跟踪算法.基于压缩感知理论,利用稀疏测量矩阵压缩多尺度图像特征.采用Median-Flow跟踪算法作为预测器,并为RV-SVM构建训练数据集,使算法能够适应真实场景中遇到的目标遮挡、3D旋转和目标快速移动等复杂情况.通过在线学习RV-SVM算法,对候选位置集进行排序,找到目标的真实位置.对不同视频序列的测试结果表明:该方法可以在目标运动、旋转以及光照和尺度发生变化的情况下实现准确的跟踪. 于慧敏 曾雄关键词:视频跟踪 压缩感知 融合有判别力仿射局部特征上下文的图像分类 被引量:2 2014年 已有的针对上下文信息的大多数工作均侧重于视觉词之间的上下文信息建模,没有考虑到局部特征之间的上下文信息建模问题,且图像在拍照时往往受到姿势、尺度变化,光照以及相机参数的影响,导致分类精度不高.文中综合考虑局部特征之间的上下文信息,提出一种基于有判别力仿射局部特征上下文的图像分类方法.对于一幅图像上的某一位置,采用该区域的局部特征,及其周边一定距离、角度内的局部特征来进行描述(局部特征上下文);然后对这些局部特征上下文进行仿射变换,并通过最小化编码损失的策略来进行有判别力的仿射局部特征上下文的选择,得到更有判别力的特征.最后通过实验结果验证了该方法的有效性. 张淳杰 熊威 张一帆 梁超 张维刚 黄庆明关键词:仿射不变性 图像分类 微博情感可视化系统 被引量:5 2014年 为了研究微博用户表达情感的特性,从个人化的情感表达和对社会性事件的态度反映两类文本出发,分别对个人情感变化以及热点事件中的用户情绪进行分析,设计并实现了微博情感可视化系统(sentiment visualization system for microblog,SVSM)。个人化情感研究记录用户在时间轴上的情绪波动,并且从性别及地域属性上分析个人情感差异;热点事件情感研究监测用户情绪的群体表达,从时间、空间、热词、用户属性、事件属性以及传播特性等角度进行特性分析。 杜贺 於志文 王志涛关键词:可视化 情感分析 基于相干性滤波器的广义旁瓣抵消器麦克风小阵列语音增强方法 被引量:8 2012年 为了克服传统麦克风小阵列语音增强算法噪音抑制能力有限的问题,该文提出一种基于相干性滤波器的广义旁瓣抵消器语音增强算法,该算法基于动态平滑系数噪声谱估计来获得相干性滤波器,分别对每个阵元接收到的信号进行滤波用以抑制包括混响等噪声信号的干扰,并把滤波后的信号作为输入信号,使用基于小阵列的广义旁瓣抵消器波束形成算法抑制残余噪声信号的干扰。模拟和实际试验表明,该文提出的算法明显优于单独使用小阵列波束形成算法和相干性滤波器算法。 杨立春 钱沄涛关键词:语音增强 基于特征点轨迹的动作识别 被引量:18 2014年 文中提出一种基于时空特征点轨迹的动作识别方法.首先为了克服局部时空特征时间信息缺失的问题,该方法采用KLT跟踪器对时空局部特征进行跟踪,将得到的时空特征跟踪轨迹作为基本的处理、描述单元.与局部时空特征相比,它能在更长的时间尺度上对运动进行描述,进而更好地捕获运动的动态变化与转变过程.其次在时空特征轨迹基础上,该方法提出了轨迹相对位置、相对速度关系元来对轨迹之间的关系进行建模.对轨迹之间的关系进行建模有助于捕获不同动作在特征分布上存在的一些比较稳定的模式.最后利用多核学习方法融合多种特征来训练动作分类器.在交互动作数据库上对提出的方法进行了实验,实验结果证明了方法的有效性. 秦磊 胡琼 黄庆明 田琦关键词:计算机视觉 人体动作识别 一种基于背景声音识别的移动社会活动推荐系统 被引量:1 2014年 随着智能手机和移动互联网的快速发展,人们的生活方式正在发生着变革。目前,智能手机终端集成了不同种类的传感器,如GPS、Wi-Fi、摄像头、麦克风等。通过内置传感器,可以搜集用户的相关信息,利用这些信息能有效地理解和识别用户行为,并为用户提供更好的个性化服务。文中主要面向大型工作或生活社区(如大学校园),提出基于背景声音识别的社会活动推荐系统MSSAR(Mobile Sound Sensing and Activity Recommender)。该系统通过音频传感器采集用户的背景声音,实时感知用户所处环境,并对用户实时活动(如在咖啡厅、在开会等)进行识别。MSSAR还能结合用户在线交互历史数据计算其偏好及社会关系亲密度,并据此为用户进行活动推荐。本系统基于以人为本的计算理念,对增强用户间社会联系、促进社区成员间活动交流具有积极意义。 杨曜 郭斌 於志文关键词:智能手机 移动互联网 LSPSA:基于局部结构保持的共享子空间分析 被引量:1 2014年 多输出正则投影(MORP)算法将输入特征向量和由类标签形成的多输出特征向量经过因子分解方法映射到一个共享子空间,从而建立输入特征与类标签的关联。在MORP的基础上,通过引入图约束,提出了一种基于局部结构保持的共享子空间分析方法(LSPSA),该方法在获取共享信息的同时,保持原始多视角特征空间与共享子空间中的数据具有相近的局部几何结构关系,从而避免多视角数据在共享子空间的过拟合问题。此外,还提出了一种图模型逼近方法,实现了LSPSA的在线扩展,解决了在线获取新测试样本在共享子空间中表征的高复杂度问题。在UCI多特征手写体数据库上的分类及检索实验验证了所提出的算法的有效性。 杜琳琳 朱振峰 段红帅 赵耀关键词:图模型