全国教育科学“十二五”规划教育部重点课题(GFA111001)
- 作品数:12 被引量:178H指数:5
- 相关作者:刘红云骆方刘源刘玥张玉更多>>
- 相关机构:北京师范大学四川省教育科学研究所香港中文大学更多>>
- 发文基金:全国教育科学“十二五”规划教育部重点课题国家自然科学基金北京市与中央在京高校共建项目更多>>
- 相关领域:哲学宗教文化科学社会学自动化与计算机技术更多>>
- 因变量为等级变量的中介效应分析被引量:123
- 2013年
- 本文聚焦于因变量为等级数据的中介效应模型,通过模拟研究比较了Logistic回归与通常线性回归的差别,并比较了这两种分析框架下常用的系数乘积法和系数差异法的优劣,同时考察了因变量类别数对估计结果的影响。研究结果表明:对因变量为等级数据的中介效应模型,应使用Logistic回归进行分析,如果使用了通常线性回归分析,会导致中介效应低估、标准误低估、置信区间对真值覆盖比例偏低等问题。对于等级因变量的中介效应估计,系数乘积法得到的结果优于系数差异法,随着等级数的增加Logistic回归与通常线性回归的差别越来越小,当因变量的类别数较多(5及以上)时,可考虑使用通常线性回归的分析方法。最后通过一个实例说明了该方法的应用。
- 刘红云骆方张玉张丹慧
- 关键词:蒙特卡洛模拟
- 基于多级计分题目的分步功能差异检验
- 2014年
- 对分步功能差异如何在项目功能差异的检测和解释中发挥作用进行阐述:(i)从国外分步功能差异的模型、方法原理、分类模式、应用和结果解释等方面对这一方法的进展和应用情况进行概括和综述,旨在对国内测验公平性的研究提供借鉴;(ii)通过实际测验的数据,采用DSF分析的方法对测验中题目及不同等级分数的DIF进行了检验,进而对产生DIF的原因进行更深入的分析,以对测验内容的审核和题目的修订提供更具体和具操作性的依据.
- 李美娟刘红云
- 关键词:项目功能差异
- 成对比较数据和排序数据的处理:模型分析的方法被引量:2
- 2016年
- 对近年来研究者所提出的瑟斯顿模型和BTL模型两大类模型进行综述,总结了目前研究者提出的2种数据分析和处理方法视角:多层线性模型(HLM)和结构方程模型(SEM).基于模型的方法不仅充分利用了成对比较和排序数据的信息,而且模型更具拓展性,如为考察协变量、潜类别等的影响提供可能,也为迫选测验等的开发提供指导意义.本文不涉及复杂的统计知识,运用心理学研究中被熟知的模型对处理成对比较数据和排序数据的模型及其模型估计进行说明,并通过Mplus软件示例,以期模型分析的方法在对成对比较数据和排序数据的处理上得到广泛的应用.
- 宋晓娟刘红云
- 关键词:多层线性模型结构方程模型
- 无铆题情况下测验分数等值方法探索——构造铆测验法被引量:5
- 2015年
- 研究旨在探索无铆题情况下,使用构造铆测验法,实现测验分数等值。研究一和研究二分别探索题目难度排序错误、铆题难度差异对构造铆测验法的影响。结果表明:(1)等组条件下,随着错误铆题比例,难度排序错误程度,铆题难度差异增大,构造铆测验法的等值误差逐渐增大,随机等组法的等值误差较为稳定;不等组条件下,构造铆测验法的等值误差均小于随机等组法;(2)对于构造铆测验法,在不等组条件下,铆测验长度越短,等值误差越大。
- 刘玥刘红云
- 高中生价值选择特点及其影响因素被引量:1
- 2014年
- 采用问卷法对某地级市47所高中22692名学生进行问卷调查,分析了高中生价值选择的特点及其与性别、居住现状(流动和留守)、父母受教育程度、学业成绩和未来选择职业标准的关系。分析结果表明:(1)价值选择中,排前三位的为亲情、健康、友情;(2)女生更加看重"亲情"和"健康",而男性更加看重"友情"、"财富"、"荣誉"和"道德";(3)留守儿童较其他群体更看重"财富",而相对不太重视"健康"、"亲情"和"友情";(4)选择"才能"、"成功"和"舒适"的学生群体学业成绩相对较高,而选择"友情"的学生群体学业成绩相对较低;(5)选择"财富"的学生在选择未来的职业时以"薪水的高低"为标准,而选择"才能"或"成功"的学生在选择未来的职业时以"职业发展前景"为标准。
- 刘晓宇刘红云
- 关键词:高中生教育程度
- 分类数据测量等价性检验方法及其比较:项目阈值(难度)参数的组间差异性检验被引量:3
- 2012年
- 测量工具满足等价性是进行多组比较的前提,测量等价性的检验方法主要有基于CFA的多组比较法和基于IRT的DIF检验两类方法。文章比较了单维测验情境下基于CCFA的DIFFTEST检验方法和基于IRT模型的IRT-LR检验方法,以及多维测验情境下DIFFTEST和基于MIRT的卡方检验方法的差异。通过模拟研究的方法,比较了几种方法的检验力和第一类错误,并考虑了样本总量、样本量的组间均衡性、测验长度、阈值差异大小以及维度间相关程度的影响。研究结果表明:(1)在单维测验下,IRT-LR是比DIFFTEST更为严格的检验方法;多维测验下,在测验较长、测验维度之间相关较高时,MIRT-MG比DIFFTEST更容易检验出项目阈值的差异,而在测验长度较短、维度之间相关较小时,DIFFTEST的检验力反而略高于MIRT-MG方法。(2)随着阈值差值增加,DIFFTEST、IRT-LR和MIRT-MG三种方法的检验力均在增加,当阈值差异达到中等或较大时,三种方法都可以有效检验出测验阈值的不等价性。(3)随着样本总量增加,DIFFTEST、IRT-LR和MIRT-MG方法的检验力均在增加;在总样本量不变,两组样本均衡情况下三种方法的检验力均高于不均衡的情况。(4)违背等价性题目个数不变时,测验越长DIFFTEST的检验力会下降,而IRT-LR和MIRT-MG检验力则上升。(5)DIFFTEST方法的一类错误率平均值接近名义值0.05;而IRT-LR和MIRT-MG方法的一类错误率平均值远低于0.05。
- 刘红云李冲张平平骆方
- 关键词:分类数据验证性因素分析项目功能差异
- 多阶段混合增长模型的影响因素:距离与形态被引量:17
- 2014年
- 通过模拟研究,考察潜类别距离和发展形态等因素对多阶段混合增长模型的模型选择和参数估计的影响:(1)潜类别距离越大,模型选择和分类效果越好。(2)混合模型的选择,应以一定样本量(至少200)为前提,首先考虑BIC选出正确的分类模型,再通过熵值、ARI等选择分类确定性较高的模型。(3)多阶段的发展形态对正确模型的选择和分类的确定性均有一定程度影响。(4)潜类别距离和样本量越大,参数估计精度越高。(5)在判断分类准确性的指标中,ARI的选择更偏向于真实的模型。
- 刘源骆方刘红云
- 不同铆测验设计下多维IRT等值方法的比较被引量:5
- 2013年
- 实际应用中测验往往具有多维结构,如果仍采用单维IRT方法进行等值,会得到不准确的结果。因此对于多维结构的测验,需要使用多维IRT等值方法来实现参数的转换。基于共同题设计,文章通过模拟研究的方法,考察了不同铆测验设计下几种多维IRT等值方法的表现,同时考虑了测验长度、两个维度题目数量的比例、铆测验长度、铆测验的选择策略、两个维度之间的相关和等值群体的能力水平差异六个因素的影响。所比较的多维IRT等值方法有:均值/均值(MM)方法,均值/标准差(MS)方法,Stoking-Lord(SL)方法,Haebara(HB)方法,最小平方(LS)方法。结果显示:(1)SL,HB和LS方法得到的等值误差均方根最小,且在各条件下表现较为稳定。(2)MM和MS方法在非等组条件下呈现出很大的误差均方根。(3)铆测验设计对SL,HB和LS方法的等值结果没有显著影响。(4)在两个维度之间的相关较高,测验长度和铆测验长度较长,等值群体的能力水平没有差异的条件下,SL,HB和LS方法得到的等值误差均方根最小。
- 刘玥刘红云
- 关键词:测验等值均值均值
- 基于增长模型的非随机缺失数据处理:选择模型和极大似然方法被引量:4
- 2015年
- 对含有非随机缺失数据的潜变量增长模型,为了考察基于不同假设的缺失数据处理方法:极大似然(ML)方法与DiggleKenward选择模型的优劣,通过Monte Carlo模拟研究,比较两种方法对模型中增长参数估计精度及其标准误估计的差异,并考虑样本量、非随机缺失比例和随机缺失比例的影响。结果表明,符合前提假设的Diggle-Kenward选择模型的参数估计精度普遍高于ML方法;对于标准误估计值,ML方法存在一定程度的低估,得到的置信区间覆盖比率也明显低于Diggle-Kenward选择模型。
- 陈楠刘红云
- 多阶段增长模型的方法比较被引量:9
- 2013年
- 多阶段增长模型(Piecewise Growth Modeling,PGM)可以解决发展趋势中具有转折点的情形,并且相对其他复杂的曲线增长模型,解释更简单。已有的统计方法主要通过多层线性模型和潜变量增长模型对多阶段模型进行估计。通过模拟研究,用HLM6.0和Mplus6.0对上述两种模型分别进行估计,结果发现在参数估计的精度上,两种估计方法没有差异,只是在犯一类错误的概率上后者略小。进一步通过对错误模型的探讨发现,在样本量小(n=50),斜率变化小(Δb=0.2)时,用线性模型拟合数据而非PGM所犯错误概率较小,整体拟合更佳。但随着样本的增加和斜率变化的增加,错误模型的犯错概率明显增大。故在实际应用中,为了能更好拟合数据,研究者应根据数据本身的情况选择恰当的模型。
- 刘源赵骞刘红云
- 关键词:参数估计