徐晓伟
- 作品数:3 被引量:7H指数:1
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 一种基于Memcached的大数据缓存交互式查询方法
- 本发明提供一种基于Memcached的大数据缓存交互式查询方法,该方法基于Spark SQL提供的构建外部数据源的方式,结合Memcached缓存的内存读写特点,对特定应用场景下的大数据存储介质作了重新的定义。同时实现了...
- 沈志宏周园春吴章生黎建辉朱小杰杜园园徐晓伟
- 文献传递
- 基于HY-FMV模型的雷暴天气预测研究被引量:1
- 2018年
- 本文以极端天气中的雷暴天气为研究对象,基于历史气象数据预测未来三小时是否发生雷暴。为预测雷暴是否发生,本文分别对极端天气气象数据的采样、数据预处理、特征选择,以及建模分析进行了研究,最终提出一种基于机器学习方法的HY-FMV模型框架对雷暴天气进行预测。该模型采用混合模型进行数据预处理,基于概率分布与模型评价进行特征的选择和构建,并使用梯度提升树算法对极端天气进行预测分类。最后,本文以2010年到2015年福建和广东两省数据为例,分别使用本文所提出的HY-FMV模型,和随机森林算法等进行雷暴天气预测,结果表明,本文所提出的HY-FMV模型在F1指标上精度达到78%,相比其他算法,在雷暴天气预测精度上提高了0.5%-0.6%。
- 谢志敏徐晓伟黄瑞芳黄瑞芳林青慧陈昕陈昕
- 关键词:混合模型
- 基于多源出行数据的居民行为模式分析方法被引量:6
- 2017年
- 基于对智能交通卡数据的挖掘与分析能够为城市交通建设和城市管理提供有力支持,但现有研究数据大都仅包含公交或地铁这两方面数据,且主要关注群体性宏观出行规律。针对这一问题,以某城市交通卡数据为例,该数据包含着城市居民日常出行公交、地铁、出租车等多源数据,首先提出行程链的概念对居民出行行为建模,在此基础上给出不同维度的周期性出行特征;然后提出一种基于最长公共子序列的空间周期性特征提取方法,并对城市居民出行规律进行聚类分析;最后通过规则定义5个评价指标对该方法的有效性进行初步验证。结果表明引入该方法的聚类算法对聚类结果有6.8%的效果提升,有利于发现居民的行为模式。
- 徐晓伟杜一周园春
- 关键词:多源数据聚类分析时空数据挖掘