李春平
- 作品数:64 被引量:295H指数:10
- 供职机构:清华大学软件学院更多>>
- 发文基金:国家高技术研究发展计划四川省科技计划项目国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术医药卫生电子电信文化科学更多>>
- 一种用户目的地点的预测方法及装置
- 本申请提供了一种用户目的地点的预测方法及装置。所述方法包括:获取所述用户使用的用户终端的位置信息;确定所述用户终端位于的位置兴趣点;确定所述用户终端离开所述位置兴趣点的离开时间信息;在位置兴趣点概率数据库中,查找所述用户...
- 丁强李春平伍健
- 文献传递
- 平行坐标及其在聚类分析中的应用被引量:16
- 2005年
- 平行坐标对多维数据的表达是数据可视化的重要方法之一。它实现了多维数据在二维平面上的表示。利用平行坐标对数据进行分析处理的技术已经取得了很大的进展,如刷(Brushing)技术、交换坐标轴、抽象等。这些分析技术已经应用到数据挖掘的很多领域,尤其在聚类分析中,平行坐标对数据集的定性分析使聚类结果的合理性得到证明。
- 翟旭君李春平
- 关键词:聚类分析数据可视化
- 基于生命体征时序数据的创伤致死性大出血伤情动态预测模型开发及验证
- 2024年
- 目的基于生命体征时序数据和机器学习算法建立创伤致死性大出血伤情动态预测模型。方法回顾性分析重症监护医疗信息(MIMIC-Ⅳ)数据库2008-2019年7522例创伤伤员的生命体征时序数据,并按照创伤后是否发生致死性大出血事件分为致死性大出血组(n=283)与非致死性大出血组(n=7239)。采用逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、自适应提升(AdaBoost)、门控循环单元(GRU)、门控循环单元-D(GRU-D)共6种机器学习算法开发创伤致死性大出血伤情动态预测模型,对创伤伤员未来T小时(T=1、2、3)发生致死性大出血伤情的风险进行动态预测。通过准确率、敏感度、特异度、阳性预测值、阴性预测值、约登指数以及受试者工作特征(ROC)曲线下面积(AUC)评估模型性能。基于解放军总医院创伤数据库对模型进行外部验证。结果MIMIC-Ⅳ数据集中,基于GRU-D算法开发的一组动态预测模型效果最优,预测未来1、2和3 h发生致死性大出血的AUC分别为0.946±0.029、0.940±0.032和0.943±0.034,且差异无统计学意义(P=0.905)。创伤数据集中,GRU-D模型取得了最佳外部验证效果,预测未来1、2和3 h发生致死性大出血的AUC分别为0.779±0.013、0.780±0.008和0.778±0.009,且差异无统计学意义(P=0.181)。该组模型已部署在公开的网页计算器和医院急诊科信息系统中,便于公众和医护人员使用和验证。结论成功开发并验证了一组动态预测模型,可对创伤致死性大出血伤情进行早期诊断和动态预测。
- 郭程娱龚明慧沈翘楚韩辉王若琳张红亮王俊康李春平黎檀实
- 关键词:创伤大出血
- 基于表码的电量数据处理方法被引量:1
- 2008年
- 从现场采集的电量表码数据直接用于电量结算时,计算出的电量值可能存在很大偏差。根据原始电量数据是等间隔的时序数据的特点,首先通过将缺失数据自动补录和异常数据自动校验修正,以保证数据的连续性和完整性;然后通过对回零、更换电表、更换电流互感器和电压互感器、旁代路等计量业务的自动处理,以简化电量计算方法;最后通过对缺失电量的手工追补和电量数据的比对校验,以减少电量的损失,进一步验证结算电量数据的正确性。该方法在河北购电管理系统中获得了很好的实践效果。
- 杨德亮范亮星李春平
- 关键词:电量计算
- 基于差分隐私保护和近邻优化的微博僵尸用户检测
- 2022年
- 僵尸用户导致的数据造假现象严重影响了微博的健康发展。针对采用基于密度的DPC算法进行僵尸用户检测时存在泄露正常用户隐私信息,以及在密度分布不均匀的微博数据中检测结果不理想的问题,提出一种基于差分隐私技术和近邻优化的僵尸用户检测方法。该方法将满足差分隐私的Laplace噪声添加至检测过程中,以实现基于隐私保护的僵尸用户检测。并通过引入反向k近邻的概念重新定义样本密度,从而更准确地反映样本点的局部信息,提高在非均匀分布的数据中僵尸用户检测的准确率。实验结果表明,该方法在实现正常用户隐私保护的同时,僵尸用户检测的准确率提高约4百分点。
- 李明娟朱焱李春平
- 关键词:隐私泄露
- 基于WordNet概念向量空间模型的文本分类被引量:28
- 2006年
- 文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表明,当训练文本集合很小时,方法能够较大地提高文本的分类准确率。
- 张剑李春平
- 关键词:文本自动分类WORDNET向量空间模型
- 数据挖掘工具集TH-Miner被引量:1
- 2006年
- TH-Miner是以Java实现的跨平台数据挖掘可视化系统。在TH-Miner中实现了多种经典的数据挖掘算法,并构造了几种新的改进算法。TH-Miner包括可视化聚类挖掘工具、分类算法工具、序列模式挖掘算法工具以及文本分类工具。
- 任靖陆甡翟旭君戴涛刘璧松李春平
- 关键词:数据挖掘工具序列模式挖掘文本分类
- 一种街景图片的地理定位方法及系统
- 本发明实施例提供一种街景图片的地理定位方法及系统。该方法包括获取一张待定位图片;使用排序特征模型和重排序特征模型对待定位图片进行图像特征向量提取,得到待定位图片的排序特征向量和重排序特征向量;使用排序特征向量和重排序特征...
- 李春平孙晨
- 文献传递
- 数据挖掘技术在税收预测分析中的应用被引量:7
- 2006年
- 本文从数据挖掘预测功能的角度介绍了数据挖掘技术,并阐述了各种方法在税务中的应用。重点介绍了两种常用于税收预测的算法,并结合税务部门的特点,给出了一个对实际工作有指导意义的预测方法。
- 李继嵬刘书明李春平
- 关键词:数据挖掘税收预测
- 面向软件开发信息库的数据挖掘综述被引量:12
- 2008年
- 总结了近年来挖掘软件开发信息库的研究工作,主要包括研究内容和采用的数据挖掘方法,最后讨论了软件开发信息库研究的未来发展前景。
- 白洁李春平
- 关键词:软件工程数据挖掘