学校增值的一致性与稳定性-基于多水平追踪数据的实证研究（上篇）(2)

　　学校增值的稳定性，指的是学校增值在不同时点上的相关程度。一般而言有两层含义，这两层含义取决于研究设计或者说所收集数据的结构。如图1所示，在多届学生设计中，增值的稳定性指的是学校增值对于不同届学生的相似程度，这一指标被称为"跨届稳定性"。对于每一届学生，分析"跨届稳定性"只需要他们在学校学习阶段的人口与出口成绩。在单届学生设计中，增值的稳定性指的是学校增值对于这届学生在不同年份之间的接近程度，这一指标被称为"跨年稳定性"。显然，"跨年稳定性"的计算需要一届学生在多个学习年份中的测试成绩。这两种稳定性虽然术语相似，但其政策含义却截然不同。"跨届稳定性"关系到增值指标的精确程度，对于家长择校意义重大。如果学校的增值指标被公布出来，而对于不同届学生学校的增值排名差异很大，就很难合理指导择校行为，因为不稳定的增值指标说明了学校效能依学生构成而变。。跨年稳定性"则关系到对学校和教师的问责。如果教育主管或督导部门依据某届学生在某一年的增值来制定奖惩政策（事实上很多评价体系都依赖于年度数据），而学校在这一年的增值排名不能合理预测第二或第三年的增值，那么增值指标在问责体系中就没有说服力和公信力。在本文中，我们主要考察学校增值的"跨年稳定性"。
　　二、研究方法
　　(一）数据说明
　　本研究所采用的数据来自国家留学基金委一德国阿登纳基金会博士资助项目"中国学校效能的探索性研究"以及国家社科基金项目"基于增值的学校绩效评价体系研究"。项目利用中国中部某区全部25所初中学校2012届学生考试成绩的三年追踪数据，以及通过学生问卷、教师问卷、教育统计报表等工具收集到的学生背景和学校背景数据，来分析城市初中学校的效能。要提及的是，中国义务教育的管理权限在区县政府，目前尚无国家一级或省一级的学生学业成就的长期追踪数据。因此，针对本文的研究问题，只能选取一个区实施探索性研究。此外，增值评价所用多水平模型的参数估计依赖于正态分布的假设，对于学生（层一）和学校（层二）的样本量有一定要求。经合组织建议每所学校的学生数至少为20-30人[3]，本文中每所学校的学生数都高于此标准。有关层二的样本量，目前并没有一致的意见，一个经验法则是20个以上[4]。本文中学校数为25所，满足分析的要求。
　　1.学生测试成绩数据
　　由于增值测量依赖于两次考试成绩，所以对于测量工具的选择尤为重要。目前，对于增值测量在考试工具上有多种选择。第一种方法是让前后两次试题完全相同。这样能让保证前后测的分数等价，但这种方法缺点非常明显，如果前后测试间隔时间较短，那么可能存在记忆效应，学生的真正进步难以测出；此外，学生的学习是接受新知识的发展过程，前后测试如果完全相同，就难以反映学生学习的增值。第二种方法是通过项目反应理论(IRT)设计标准化试卷，前后测试的部分试题相同，对两次考试进行垂直等化链接，让两次测试的分数能直接比较。这种方法的优点是认为学生学习是一个累积过程，但对于试题制定的技术要求较高，在标准化考试非常流行的国家如美国运用较多，但在我国尚无成规模的应用。其缺点则是测试更强调不同年级中所学的共同内容，对教学的敏感度不高[5]，且据此估算的增值排名对所选择的链接方法非常敏感[6]。第三种方法是根据经典测试理论和课程内容本身设计前后试题，在增值模型中运用标准分。这种方法在标准化考试不甚流行的国家，特别是在关键考试中以等级计分的英国，非常受欢迎。该方法比较简单易行，符合我国的教育评价国情，其缺点是标准分增值所测量的并非学生绝对进步，而是学生在两次测试中成绩在总体中相对位置的变化。本研究采用的测试依据的是第三种方法，即该区本身实施的区统考以及2012年的中考。

　　论文榜（www.zglwb.com），是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导，寻求投稿辅导代理，快速投稿辅导，投稿辅导格式指导等解决方案：省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


期刊鉴别	论文检测	免费论文	特惠期刊	学术答疑	发表流程

搜索

学校增值的一致性与稳定性-基于多水平追踪数据的实证研究（上篇）(2)