丁家满 作品数:191 被引量:173 H指数:7 供职机构: 昆明理工大学 更多>> 发文基金: 国家自然科学基金 云南省应用基础研究基金 云南省教育厅科学研究基金 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 机械工程 更多>>
一种基于狼群优化算法的面向长尾分布数据的联邦学习方法 本发明涉及一种基于狼群优化算法的面向长尾分布数据的联邦学习方法,属于联邦学习技术领域。本发明首先由服务器向客户端分发随机初始化的模型参数;其次客户端独立使用本地数据进行训练后将模型参数上传至服务器;然后服务器利用狼群优化... 付晓东 普骏程 刘骊 彭玮 刘利军 丁家满 贾连印一种基于深度森林机械轴承故障检测方法 本发明涉及一种基于深度森林机械轴承故障检测方法,属于故障检测技术领域。首先,将采集到的正常轴承数据和多种故障轴承数据根据振动频率f分别进行多粒度采样策略进行分组,得到N组采样数据,再将N组采样数据分别进行特征提取,得到N... 丁家满 吴晔辉文献传递 一种基于查错率的测试用例选择方法 本发明涉及一种基于查错率的测试用例选择方法,属于测试用例选择领域。本发明将所有测试用例按照所选策略循环分组并执行,分析每个分组测试用例的执行结果,得到每个分组测试用例的查错率,当本次查错率小于上一次查错率时,循环终止。本... 姜瑛 李翘婕 刘英莉 汪海涛 丁家满 李凌宇文献传递 一种云故障数据的决策方法及系统 本发明涉及一种云故障数据的决策方法及系统,属于云故障领域。本发明文件操作模块,用于对云故障数据文件的打开、分析:文件打开模块,用于选择打开云故障数据文件;文件分析模块,用于获取云故障数据文件的特征属性和类别属性;决策结果... 姜瑛 黄婕 丁家满 刘英莉 李凌宇 汪海涛文献传递 一种基于属性相似性和分布结构连通性的聚类算法 2024年 聚类分析针对不同的数据特点采用不同的相似性度量,现实世界中数据分布复杂,存在分布无规律、密度不均匀等现象,单独考虑实例属性相似性或分布结构连通性会影响聚类效果。为此,提出了一种基于属性相似性和分布结构连通性的聚类算法(A Clustering Algorithm Based on Attribute Similarity and Distributed Structure Connectivity, ASDSC)。首先,利用待聚类数据集中的所有数据实例构建完全无向图,定义了一种兼顾属性相似和分布结构连通的新颖相似性度量方式,用于计算节点相似性,并构造邻接矩阵更新边的权重;其次,借助邻接矩阵执行递增步长的随机游走,依据顶点的连通中心性来识别簇中心并给定簇编号,同时获取其他顶点的连通性;然后,利用连通性计算顶点间的依赖关系,并据此进行簇编号的传播,直至完成聚类。最后,为了验证该方法的聚类性能,在16个合成数据集和10个真实数据集上与5种先进聚类算法进行了对比实验,ASDSC算法取得了优异性能。 孙浩文 丁家满 李博文 贾连印关键词:聚类 一种基于Spark平台的频繁项集挖掘方法 本发明涉及一种基于Spark平台的频繁项集挖掘方法,属于数据挖掘技术领域。本发明基于Spark大数据处理框架,提出了一种新颖的BitMapFIM‑Miner算法,并行化处理数据集,且不需要对数据集进行多次扫描,基于分治的... 丁家满 李海滨文献传递 一种云计算故障数据检测方法及系统 本发明涉及一种云计算故障数据检测方法及系统,属于云故障检测领域。本发明包括:云计算故障训练数据处理步骤,对云计算故障训练数据集中的数据进行处理,得到每条故障训练数据的隶属度、每个故障类别的故障特征权重;待检测云计算数据所... 姜瑛 刘诚诚 李凌宇 刘英莉 丁家满 汪海涛文献传递 一种基于近邻熵边界聚类的脑区分割方法 本发明涉及一种基于近邻熵边界聚类的脑区分割方法,属于数据挖掘、机器学习中的聚类分析应用技术领域。本发明提出一种寻找脑区边界的聚类算法,首先划分数据点周围的空间区间,统计各区间块的近邻点数,拓展熵公式,计算数据点的近邻熵,... 丁家满 殷锦园 贾连印 付晓东 姜瑛一种撞击流超重力液液萃取器 本发明涉及一种撞击流超重力液液萃取器,属于化工及冶金设备技术领域。该撞击流超重力液液萃取器,包括动力传递结构、液体收集器机构、转轴结构、液体传质结构及固定构件结构,动力传递结构为上下两套对称的动力传递机构,将萃取液体喷入... 杜奕 常军 彭金辉 张利波 丁家满文献传递 Spark环境下的分布式OLAP查询 被引量:3 2017年 数据立方体是数据仓库的核心数据模型,其元组可以划分为封闭元组和非封闭元组,通过去掉非封闭单元进行压缩并分层形成了分层封闭立方体.以Hadoop为主的云计算环境通常以离线批量计算为主,查询分析有一定的延迟,不能达到OLAP的在线性和交互性.Spark是一个基于内存的快速通用的大数据并行计算框架,对此本文基于分层封闭立方体,利用Spark,设计和实现了两种有效的分布式OLAP查询算法:SLCCQuery及其优化算法SLCC_Layered Query.不同参数的数据集上的实验验证了本文提出的Spark环境下的分布式OLAP查询算法的有效性及其优化算法的相对高效性. 崔红波 游进国 简兴明 张正凡 丁家满关键词:SPARK OLAP查询