王明秋
- 作品数:6 被引量:1H指数:1
- 供职机构:曲阜师范大学更多>>
- 发文基金:山东省自然科学基金更多>>
- 相关领域:理学自动化与计算机技术更多>>
- 基于调整秩回归的组变量选择
- 2022年
- EXP惩罚是一种指数形式的惩罚函数,它近似于L_(0)惩罚. EXP惩罚最小二乘估计具有模型选择的相合性和渐近正态性.但是,惩罚最小二乘方法对重尾分布和含有异常值的混合分布的效果并不理想.该文考虑回归模型中的变量是以组结构形式存在的,研究基于调整秩回归的EXP型组变量选择,给出了调整秩回归估计的理论性质,并通过数据模拟和实例分析,检验调整秩回归的EXP惩罚的效果,结果表明这种方法具有较好的表现.
- 王萧博吴贤君王明秋
- 基于最小距离法的稳健群组变量选择
- 2024年
- 在研究存在异常值的logistic回归模型时,发现如果使用极大似然估计(MLE)方法进行参数估计,那么异常值引起的偏差不是造成参数估计过大而是导致参数向量内爆即参数向量收缩为零向量,此时如果进行群组变量选择很可能会忽略一些重要变量.因此针对具有组结构的logistic回归模型,为处理解释变量存在异常值时的群组变量选择问题,将基于最小距离法的稳健估计(L_(2)E)方法与已有的3种群组变量选择方法和3种双层变量选择方法结合,在此基础上利用Majorization-Minimization(MM)算法对目标函数进行求解.通过数值模拟比较了基于L_(2)E方法和MLE方法在模型具有组稀疏和双层稀疏的情况下,6种变量选择方法在不同维数下的有限样本表现,结果不仅验证了L_(2)E方法在存在异常值的logistic回归模型参数估计中的稳健性,而且指出了在这6种变量选择方法中使用Group Bridge方法进行变量选择的准确度更高.
- 李冬梅王明秋王秀丽
- 关键词:LOGISTIC回归模型
- 基于稳健距离的大数据Logistic回归最优子抽样
- 2024年
- 大数据统计分析在有限的计算资源下面临一些挑战性问题,用子数据代替全数据进行统计分析成为一种选择。文章基于最小协方差行列式的稳健距离,为大数据Logistic回归模型提出了一种更高效的子数据选择算法。通过大量的数值模拟,在不同的标准下比较了所提算法与其他已有算法的性能。结果表明,所提算法具有较高的估计效率和计算效率,与全数据相比,计算时间显著减少。与其他算法相比,所提算法得到的子数据信息矩阵行列式的值更大。同时,当协变量之间存在高度相关性时,所提算法具有稳健性。最后,通过对实际数据集的分析,说明了所提算法的预测误差更小。
- 韩潇王明秋赵胜利
- 关键词:信息矩阵
- 广义狄利克雷型分布不完全分类数据的统计分析及贝叶斯抽样
- 2023年
- 在社会学、心理学、保险学和流行病学等学科中,研究人员经常利用类别变量来研究现象的分布特征或者因素之间的关联。本文提出在类别变量的研究中存在一类不完全分类数据,其观测数据的似然函数具有广义狄利克雷型分布的形式。首先,利用EM算法和一种新的基于共众数思想的优化方法计算参数的极大似然估计。其次,在贝叶斯分析中,建立新的结合等高共众数方法的采样重要性重抽样算法来实现广义狄利克雷型分布的有效后验样本抽样。并将所提出的方法用于两组实例数据的分析,实证分析结果表明了本文所提出的方法在一般的不完全分类数据分析中的有效性和实用性。
- 张弛刘寅田国梁王明秋
- 广义线性模型基于SCAD和MCP的组变量选择方法研究
- 2017年
- 组变量出现在许多统计建模问题中,如回归模型中的多水平分类变量可以由一组哑变量表示.Group MCP和Group SCAD因具有Oracle性质被广泛使用.该文将这两种方法应用于广义线性模型,分别在Logistic回归模型和Poisson回归模型中研究了基于Group SCAD和Group MCP的组变量选择.通过数据模拟和实际数据分析,验证了这两种方法具有非常好的表现.
- 孔璐王明秋
- 关键词:广义线性模型GROUPSCADGROUPMCP
- 融合基础属性和通信行为的移动用户个性化推荐被引量:1
- 2023年
- 基于经典矩阵分解模型,提出融合用户基础属性和通信行为的矩阵分解模型,对比两种模型在评分预测和Top-N推荐问题上的表现。对评分预测问题采用RFM模型构造用户-产品评分矩阵,并结合移动产品的特点对RFM模型中部分指标进行调整,得到能够更加准确、客观地反映用户对产品兴趣偏好的评分矩阵。对Top-N推荐问题采用将用户未有过订购行为的热门产品优先纳入负样本的负采样方法。结果表明,融合用户基础属性和通信行为的矩阵分解模型在两种问题上具有更好的表现。
- 吴贤君唐绍诗王明秋
- 关键词:移动用户RFM模型评分预测