流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window,CD-TW)方法.该方法借助栈和队列对流数据进行存取,借助窗口机制对流数据进行分块学习.首先创建2个分别加载历史数据和当前数据的基础节点时序窗口,通过比较二者所包含数据的分布变化情况来检测概念漂移节点.然后创建加载漂移节点后部分数据的跨度时序窗口,通过分析该窗口中数据分布的稳定性检测漂移跨度,进而判断概念漂移类别.实验结果表明该方法不仅能够精确定位概念漂移节点,同时在漂移类别判断方面也表现出良好性能.
流数据作为大数据的重要形式广泛存在于实际问题中,由于流数据中数据分布变化产生概念漂移,容易导致模型的泛化性能下降,且在实际应用问题中,数据标记成本较高,难以获得强监督的信息.针对以上问题,本文提出一种基于在线深度神经网络的弱监督概念漂移检测(Weakly supervised conceptual drift detection method based on online deep neural network,WSCDD)方法.该方法设计了一种在线深度神经网络模型,采用Hedge反向传播方法在线学习网络深度,并通过设计Dropout层在模型预测时引入随机性,利用蒙特卡罗方法量化深度神经网络模型的预测不确定性,通过自适应滑动窗口技术检测弱监督环境下概念漂移的发生,并使模型适应新的概念.实验结果表明,该方法可以准确检测数据流中概念漂移的发生,在漂移发生后能够快速收敛到新的数据分布,提高了学习模型的泛化性能.
深度学习的优势在于其具有深层次的特征提取结构,而随着层数的增加以及激活函数的影响往往会导致其编码能力下降.基于此本文提出了一种基于U-Net和FCN网络进行编码约束的方法,并应用到医学图像分割上.编码约束结构以U-Net和FCN全卷积网络模型架构为主体,对网络最后一层使用Sigmoid激活函数的1×1卷积层进行特征约束,通过将特征值向0.5靠近预防Sigmoid激活函数产生的梯度消失问题,同时要求特征值不能集中在0.5附近,最终在保持特征区分度的前提下规范编码值,进而提升网络编码能力.本文在Finding lungs in CT二维肺部分割数据集和肝脏数据集上分别进行了实验,实验结果表明本文方法能够有效的预防梯度消失的同时提升全卷积网络特征的编码能力,进而能有效地提升分割性能.
随着新兴产业的快速发展,社会经济中各类复杂决策问题不断涌现,复杂决策问题的有效求解离不开推进体现科学化与民主化的群决策。图像模糊集作为直觉模糊集的推广形式,在实际应用中能够高效处理信息不一致的问题。本文针对图像模糊三支群决策问题,由于传统损失函数受决策者主观因素的影响进而在构造阈值时各有不同,探索了面向三支群决策的多粒度图像模糊概率粗糙集模型与方法。首先,本文将图像模糊的概念与三支群决策模型相结合,提出可调多粒度图像模糊概率粗糙集模型。然后,计算属性权重和专家权重时运用离差最大法。鉴于VIKOR(多准则妥协解排序)法能够同时考虑群体效用最大化和个体遗憾最小化并融入决策者主观偏好,利用VIKOR法进行多粒度图像模糊粗糙隶属度的最优粒度选择,进而建立图像模糊三支群决策方法。最后,通过一个UCI(University of California Irvine)数据库中的实例证实本文所构建方法的可行性。