国家自然科学基金(60402008) 作品数:9 被引量:34 H指数:3 相关作者: 李伟 李晓强 王淞昕 陈芳 陆佩忠 更多>> 相关机构: 复旦大学 上海大学 上海财经大学 更多>> 发文基金: 国家自然科学基金 国家教育部“211”工程 上海市科学技术发展基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于小波包最优基的音乐指纹提取算法 被引量:7 2009年 数字音乐指纹提取的主要目的是建立一种有效机制,用于比较2个音乐文件的听觉质量。提出一种基于小波包最优基分解的音乐指纹提取算法,利用与音频内容密切相关的小波包系数,将其作为特征进行指纹提取。实验结果表明,该算法对MP3,WMA和RM压缩、噪声、Stirmark for audio工具中常见的音频信号处理具有强鲁棒性,且在不同音乐之间具有较高可区分性。 陈芳 李伟 李晓强关键词:小波包变换 鲁棒性 数字音频指纹技术综述 被引量:17 2008年 近年来,互联网上出现了海量音乐信息,手工选取某首歌曲很多时候已经变得不可能.这直接促使产生了能够进行音乐自动识别的数字音频指纹技术,并成为研究界和工业界一个非常活跃的研究开发领域.数字音频指纹是指可以代表一段音乐重要声学特征的基于内容的紧致数字签名,其主要目的是建立一种有效机制来比较两个音频文件的感知听觉质量,可用在音频识别、内容完整性校验等应用中.本文介绍音频指纹技术的产生背景、基本概念及性质、典型应用场合及模型,澄清了音频指纹这一术语在音频识别和音频水印中的区别,综述了现有的绝大多数典型音频指纹算法,最后讨论了存在的问题并提出了可能的解决方案. 李伟 李晓强 陈芳 王淞昕XML数据流分页频繁子树挖掘研究 被引量:2 2012年 随着XML数据流的广泛应用,从挖掘XML数据流中发现知识具有重要的理论与应用价值.相比其他频繁模式挖掘,大型XML文档与数据流的频繁子树挖掘面临困难:XML数据流不可能整体在内存解析;对XML数据流分段挖掘必须考虑XML数据的半结构化特征等.针对上述问题,提出数据流分页频繁子树挖掘模型Tmlist.Tmlist对XML数据流进行分页,管理跨页节点及频繁候选子树的跨页增长,逐页挖掘频繁子树;频繁候选子树的增长根据根节点层次由浅至深地在最右路径加入频繁候选节点,避免以低层次为根子树的重复性递归增长;对频繁候选子树采用子树拓扑序列和最右路径共同标识,子树的增长不需要对子树前缀进行匹配,省去前缀节点存储与匹配开销;以页面最小支持度对频繁候选子树按页筛选,子树按页面衰减度衰减支持度、剪枝.Tmlist在可控误差范围内降低频繁子树挖掘的空间消耗,提高内存利用率和挖掘效率. 雷向欣 杨智应 黄少寅 胡运发关键词:XML 数据流 分页 频繁子树 数据挖掘 基于小波包最优基的音频内容软认证算法 被引量:1 2009年 音频认证可以分为硬认证、基于质量和基于内容的软认证等三种。硬认证只允许格式转换和无损压缩,基于质量和内容的软认证则分别允许一些保持听觉质量或语义的音频处理。在绝大多数应用环境下,需要对音频进行与人类听觉感知系统特性相符合的基于内容(语义)的软认证。音频认证可采用数字水印或数字签名,提出一种基于小波包最优基分解的数字签名算法,利用与音频内容密切相关的小波包系数作为特征进行语义级的认证。实验结果表明该算法对常见的信号处理MP3、WMA、RM等中等强度的有损压缩、添加噪声、重采样等保持内容操作具有很强的鲁棒性,而对局部替换、修改、删除、复制音频等恶意操作脆弱,并能准确定位被篡改的位置。 陈芳 李伟 李晓强关键词:小波包变换 一种新的音频内容认证算法 被引量:6 2007年 多媒体数据的可信度经常受到置疑,没有法律效应,原因在于数字产品的可编辑性,需要一个安全的认证系统来确定其内容是否被伪造或特殊处理过。该文提出了一种音频内容认证系统,在原始音频的离散小波域中嵌入认证信息,采用相关检测。该算法在抵抗中等强度的MP3有损压缩、上下行采样等保持内容的音频信号处理的同时,能够检测出恶意篡改等攻击,并精确定位篡改位置,还能对被篡改的音频片段进行近似恢复。 袁一群 李伟 陆佩忠关键词:半脆弱水印 基于描述逻辑的图像检索框架 2010年 提出一种新的基于描述逻辑的、能处理带有分层信度的图像语义信息的图像检索框架,以解决不确定背景知识的图像检索问题.该框架能处理具有分层信度的不确定语义信息,给出了形状及语义两层模型表述图形信息,提出一种能描述分层信度知识的描述逻辑U-ALC,将图像信息检索化归为描述逻辑U-ALC中的逻辑推理,并给出了描述逻辑U-ALC的推理算法. 王淞昕关键词:图像检索 描述逻辑 模糊择优逻辑的数值扩充 被引量:1 2008年 提出一种新的模糊逻辑——数值模糊择优逻辑,给出了数值模糊择优逻辑的语法和语义,并研究了其性质.该逻辑结合多值逻辑和择优推理的语义特点,得到的推理关系具有模糊性、次协调性和非单调性,且知识的模糊性能以数值的形式显式地表现,适用于对智能系统中的不精确、不一致和不完备知识进行表示和推理. 王淞昕关键词:模糊逻辑 非单调 连续型抗共谋数字指纹研究 被引量:1 2010年 在数字媒体版权保护领域中,具有盗版追踪能力的数字指纹是解决共谋攻击问题的重要技术手段。提出一种新的连续型指纹方案——OFFO指纹:其主要思想是使用正交向量构造最优聚焦(追踪)指纹(OFF),保证在共谋攻击发生时能够以最大概率检测出至少一个共谋者。理论分析与大量实验表明,OFFO指纹不仅在性能方面优于连续型正交指纹和n-simplex指纹,而且构造简单易于实现。 潘广毅 李晓强 李伟关键词:抗共谋 数字指纹 能处理分层信度知识的描述逻辑PB-SHOIN(D) 2008年 对描述逻辑SHOIN(D)进行扩展,提出一种能处理分层信度知识的描述逻辑PB-SHOIN(D),给出了PB-SHOIN(D)的语法和语义,并证明了PB-SHOIN(D)具有超协调性和非单调性,为表示和处理语义Web中具有分层信度的知识提供了一种有效方法. 王淞昕关键词:WEB本体语言 描述逻辑