宋韶旭
- 作品数:51 被引量:35H指数:3
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学交通运输工程机械工程更多>>
- 数据处理方法及装置
- 本申请实施例提供一种数据处理方法及装置,其中,方法包括:从终端设备获取待处理时序数据,所述待处理时序数据中包括N个数据点,N为大于1的整数;根据所述待处理时序数据,确定满足预设条件的异常数据点并标记所述异常数据点;所述预...
- 宋韶旭赵东明贺文迪龚怿焜王建民
- 一种基于深度学习的驾驶轨迹能耗分析方法和装置
- 本发明实施例提供一种基于深度学习的驾驶轨迹能耗分析方法和装置。该方法包括获取目标车辆的驾驶轨迹数据,根据驾驶轨迹数据计算获得当前时刻所述目标车辆对应的速度和加速度;将速度和加速度输入至第一关系模型中,获得与速度和所述加速...
- 宋韶旭方晨光桂阿璨王建民
- 文献传递
- 基于语义关联的文本聚类方法
- 文本聚类技术将大量文本信息按照一定的相似关联进行自动归类,使得更好更快的浏览和查找相关信息。与结构化数据挖掘对象有所不同,文本聚类所处理的数据对象主要是一些非结构化或半结构化的文档数据,具有数据稀疏性的特点。根据文本数据...
- 宋韶旭
- 关键词:文本聚类数据挖掘无监督学习语义关联
- 文献传递
- 一种错误数据容忍的虚警过滤方法和装置
- 本发明实施例提供一种错误数据容忍的虚警过滤方法和装置。该方法包括获取传感器测量得到的设备对应的时序数据,根据所述设备正常运行所对应的状态参数值,确定所述时序数据中包括的疑似时间序列;根据预设的相似度匹配方法,计算每一所述...
- 宋韶旭刘志成王建民王晨
- 文献传递
- 一种图片拍摄区域识别及地理定位方法及装置
- 本发明公开了一种图片拍摄区域识别及地理定位方法及装置,所述方法包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇...
- 李春平高玺艳宋韶旭
- 文献传递
- 一种识别时间序列的数据模式的方法及装置
- 本发明实施例提供一种识别时间序列的数据模式的方法及装置,所述方法包括:获取待识别数据模式的时间序列;所述时间序列中每个时刻对应有观测所述数据模式的观测值;根据所述观测值,以及预设数值范围对应的事件,确定所述时间序列每个分...
- 王建民宋韶旭王晨高彧
- 文献传递
- 一种时间戳修复方法及装置
- 本发明实施例提供一种时间戳修复方法及装置,该方法包括:基于密度异常检测算法对数据点进行异常检测,得到异常数据点集合信息;基于任意最优求解方法对异常数据点集合信息进行分析,得到目标时间戳修改信息;根据目标时间戳修改信息对异...
- 宋韶旭龚怿焜王建民
- 文献传递
- 基于数据质量规则的缺失结果解释约减被引量:2
- 2013年
- 由于数据缺失等原因,用户在查询结果中可能没有得到预期的答案.现有的方法通过枚举可能的缺失记录来解释"为什么没有why-not"的问题.然而,枚举得到的解释数量庞大,用户无法逐一浏览确认缺失数据.实际上,这些可能的解释中有许多是不合理的,如何约减解释数量存在挑战.根据真实数据试验,利用数据中存在的唯一性约束来进行约减,生成的解释数量仍有几十万个.研究利用数据质量规则(如函数依赖)来高效约减缺失结果的解释.首先,提出一种基于函数依赖的解释约减算法FDR(functional dependencies-based reduction).其次,为了辅助用户浏览生成的解释,进一步研究利用近似函数依赖对解释进行排序.真实数据实验表明,FDR方法能够比现有的方法减少2~5个数量级的解释(从几十万个减少至几千个甚至几十个);利用近似函数依赖排序的Top-1解释精确率达到90%以上.
- 张奥千宋韶旭王建民
- 关键词:数据质量函数依赖
- 一种基于界标的数据填补方法及装置
- 本发明实施例提供一种基于界标的数据填补方法及装置,该方法包括:获取待填补的原始数据,所述原始数据包括完整数据行和缺失数据行;将所述原始数据中的完整数据行输入至预设的生成对抗网络模型,输出完整数据行的界标;根据完整数据行的...
- 宋韶旭方晨光王建民
- 文献传递
- 一种近似分位数计算方法及装置
- 本发明实施例提供一种近似分位数计算方法及装置,该方法包括:依次读取互联网流式数据集中的各个数据信息,更新等深直方图信息,直至读取所述互联网流式数据集中所有数据,得到目标等深直方图信息;根据分位度信息确定近似分位数在所述目...
- 宋韶旭陈之威王建民
- 文献传递