樊亚莉
- 作品数:19 被引量:18H指数:2
- 供职机构:上海理工大学理学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:理学自动化与计算机技术文化科学更多>>
- 稳健的变量选择方法及其应用被引量:3
- 2013年
- 在已有的变量选择方法和稳健估计方法的基础上,提出了一种针对纵向数据的稳健的变量选择方法,通过模拟衡量其稳健性,并将其应用到一组实际的纵向数据分析中.模拟和实例分析结果表明,提出的稳健的变量选择方法在选择变量、估计变量系数的同时,对数据中可能存在的异常值有明显的抵抗作用.
- 樊亚莉徐群芳
- 关键词:惩罚函数稳健性
- 具有AR(1)误差的线性模型
- 该文研究误差服从一阶自回归的线性回归模型的统计推断问题.这种模型在许多领域,特别是在经济、管理、工程技术等领域具有广泛应用.该文提出了方差参数的一种新的估计方法,研究了它的一些统计性质.若以均方误差作度量估计优劣的标准,...
- 樊亚莉
- 关键词:自相关数值模拟卡方检验
- 文献传递
- 纵向数据下广义经验似然方法的有效稳健估计被引量:3
- 2019年
- 基于广义经验似然估计方法,提出了一种有效且稳健的估计,实现对纵向数据在线性模型下均值和协方差矩阵的联合估计。利用Cholysky分解将模型重参数化,利用拉格朗日乘子法求出估计值,再还原出均值和协方差矩阵的估计。在模拟研究中将所提方法同文献中其他稳健估计进行比较,结果显示所提方法效率更高。最后将所提方法用于分析CD4细胞数据,交叉验证结果显示所提方法更加可靠。
- 徐孝琳樊亚莉苏依官
- 关键词:纵向数据稳健性有效性经验似然
- AR(1)模型下F检验的性质被引量:1
- 2005年
- 讨论误差服从一阶自回归的线性模型关于回归系数的线性假设检验问题.在方差参数已知的情况下,研究了检验统计量的性质;在方差参数未知时,采用前三阶中心矩相等的方法,提出两种近似检验方法.模拟结果显示,当误差正相关程度较高时,两种近似检验在具有较小的第一类错误的同时,具有较大的功效.
- 樊亚莉王林平
- 关键词:功效函数
- 带有错误标签的张量数据的稳健多分类模型
- 2024年
- 传统机器学习方法大多都是基于正确标签的训练数据进行监督学习,但实际观测到的训练数据标签极可能受到污染,而错误标签的存在会导致传统模型产生有偏估计。现存的关于错误标签的稳健模型往往基于向量数据进行分类,面对存在错误标签的高阶张量数据时只能将其转化为低阶格式,由此产生过拟合问题且破坏张量结构。针对上述问题提出一种稳健的张量多分类模型(RMLTMLR),基于最小γ-散度估计、张量管道秩及相应的核范数来处理带有错误标签的低秩张量,在利用张量结构特点的同时使模型对污染标签具有稳健性,提高多分类准确率。进行的大量实验表明RMLTMLR模型在不同类别和污染程度的张量数据上有着优良的分类效果,与非稳健的模型相比,分类准确率显著提升。
- 张家瑞樊亚莉
- 一种有效且稳健的变量选择方法
- 2023年
- 当数据中存在异常值时,一些基于最小二乘估计的统计模型会产生较大的偏差,最小一乘估计对异常值具有比较强的抵抗能力。考虑到数据中可能存在异常值的情况,用绝对值损失代替平方损失,针对同时具有变量稀疏性和相邻系数差分稀疏性这种结构的线性模型,提出了最小一乘融合熔断自适应岭估计模型(LAD-Fused-BAR)。该模型将上一步估计的回归系数倒数的平方作为下一步惩罚权重,自适应地给予不同变量不同的惩罚,通过不断迭代得到最终解。运用交替方向乘子法(ADMM)求解LAD-Fused-BAR模型,并证明了ADMM算法的收敛性。数值模拟和实证分析也验证了该模型的有效性和稳健性。
- 胡毓榆郭子君陈梦醒樊亚莉
- 基于张量低管道秩的图像多分类模型被引量:1
- 2024年
- 传统机器学习方法在对高阶张量数据进行分类时,往往将其转化为低阶格式,由此会产生过拟合问题并且破坏张量的结构。针对上述问题提出一种基于张量低管道秩的多分类模型(LRTMLR)。该模型可以直接对张量格式的图像进行分类,使用由张量–张量积诱导的张量管道秩及相应的张量核范数来处理低秩张量,更好地利用张量结构特点,提高张量格式图像的多分类准确性。在三分类仿真数据集上,LRTMLR的分类准确率较无结构信息(MLR)、带矩阵结构信息(LRMLR)的方法均提升9.6个百分点,在五分类仿真数据集上则分别提升23.2和25.2个百分点。在加州理工大学的101类彩色图像识别数据集的三分类、五分类和十四分类子集上,LRTMLR的分类准确率较MLR分别提升了10.01、25.61和40.78个百分点,较LRMLR分别提升了10.68、25.61和40.78个百分点,与基于CP分解的方法(MCPLR)相比提高了6.47、13.37和27.73个百分点,与基于Tucker分解的方法(MTuLR)相比提高了1.79、12.38和13.71个百分点。并在消融实验中证明了创新的有效性。
- 张家瑞胡毓榆唐开煜樊亚莉
- 关键词:图像分类
- 应用数学专业概率论实验课程的教学设计与思考被引量:2
- 2018年
- 概率论是应用数学专业的一门专业基础课程,在培养学生理论联系实际和创新创造能力等方面,具有非常重要的作用。目前概率论的教学,普遍存在重理论轻应用的现象,这就使得学生对概率论中众多思想方法,如大数定律、中心极限定理等,缺乏深刻理解,也难以运用到实际问题中。在培养应用型和创新型数学专业人才的指导思想下,通过4个系列8个课时的实验课程设计,阐述了如何将概率论课程和实际应用问题结合起来,促进学生自主学习,培养学生的分析问题解决问题能力和创新能力。
- 樊亚莉
- 关键词:概率论实验课程R软件
- 稳健经验似然估计方法被引量:1
- 2019年
- 在经验似然方法的基础上提出了一种稳健的经验似然估计方法,在约束条件的估计方程中使用权重函数以及有界得分来限制异常点的影响。通过数值模拟研究该方法的稳健性。模拟结果表明,相比普通的经验似然估计,提出的稳健经验似然方法在数据中存在异常值的情况下所得估计的均方误差更小。同时对于非正态的厚尾分布数据,提出的稳健经验似然估计也在均方误差意义下更优。
- 苏依官樊亚莉徐孝琳
- 关键词:经验似然稳健性
- 一种稳健的半监督自训练分类方法
- 2024年
- 半监督自训练分类器性能很大程度上依赖于伪标签的质量。论文提出一种稳健的带有l2正则化的逻辑回归半监督自训练分类方法。该方法首先在有标签数据集上训练带有l2正则化项的逻辑回归模型作为初始分类器,然后使用随机森林训练残差模型和稳健马氏距离提高伪标签的质量,提升半监督自训练分类器性能。数值实验结果验证了算法的准确性和稳健性。
- 陈梦醒樊亚莉胡毓榆
- 关键词:半监督分类