作者:尹忠根/重庆第二师范学院讲师;孟现录/重庆第二师范学院副教授;李采丰/重庆第二师范学院教授。

本文摘要

新时代背景下,探索增值性评价的理论创新和本土化应用对于全面深化教育评价综合改革具有重要作用。反思当前我国学生体质健康评价当中存在的不足,主要表现为:评价目的重定级轻应用、评价对象重整体轻个人、评价内容重显现轻挖掘、评价方法重数值轻增值。因此,基于发展性、个性化、系统性、科学性的基本原则,该研究构建了学生体质健康增值性评价模型。评价模型包括指标内容、阶梯设置、层级赋分和价值判断四部分,并且从建立信息化体质健康数据库、树立增值性评价理念、设立评价分析工具、创立教育评价生态四个方面提出学生体质健康增值性评价模型的应用建议。

《深化新时代教育评价改革总体方案》(以下简称《方案》)是我国建设教育强国的坚实基础,也是我国实现教育现代化必须遵循的核心蓝图。《方案》中要求“坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价”,这对于各种评价方式的实施提出了指向性的建议。增值性评价作为一种新颖的评价方式,首次出现在我国政策性文件当中,为教育评价的实施提供了新的方向。且增值性评价是一种利用标准化测验的各级各类数据,并运用统计学分析方法,来对学生各类成绩的前后变化进行评价的方法,这与《方案》中指出的“要充分运用当前发达的信息技术,以提高教育评价的科学性”精神不谋而合。这类方法由于其评价的公平性和科学性,在欧美国家得到广泛应用与实践,但是增值性评价如何本土化应用,还需要加强在理论和实践方面的探索。 

同时,《方案》在强化体育评价中强调,将达到国家学生体质健康标准要求作为教育教学考核的重要内容。“健康中国2030”建设中,明确提出学生体质健康测评优秀率达到25%的目标,且学生体质健康成绩要作为其在各个学习阶段毕业的硬性要求,学生体质健康评价已然成为国家相关战略决策关注的重点。青少年体质健康作为学校教育领域的重要内容,也是关系国家建设和民族兴旺的基础保障。新时期国外体质健康测评系统与互联网、移动终端结合,运用在线工具综合评价青少年体质健康状况。新时代背景下,如何深化学生体质健康评价改革,对学校教育教学效能进行科学评价,对于扭转不科学的教育评价导向,加快教育现代化具有十分重要的意义。增值性评价为学生体质健康测评提供了新的思路,在学生体质健康领域实施增值性评价,能够创新评价形式,为建设科学而公平的现代化教育体系提供理论和技术支持。

一、学生体质健康评价体系的反思 

儿童青少年的健康成长关乎着中华民族的伟大复兴,我国对于儿童青少年的体质健康监测主要是通过一学年的体质健康测试,运用《国家学生体质健康标准》(以下简称《标准》)对儿童青少年的身体形态、身体技能和身体素质等方面进行综合性评价。但是,从教育部2020年发布的全国学生体质健康达标率的动态变化来看,抽测复核数据中有近三成的大学生体质健康测评不及格,初中生有近15%的不合格率,小学生不合格率为6.5%,学生的体质健康不合格率呈伴随着年龄升高而增长的趋势。评价作为教育的指挥棒,有什么样的评价就有什么样的教育,什么样的评价导向就会出现什么样的行为。当前我国学生体质健康状况不理想,与评价体系的缺陷密不可分。 

(一)评价目的重定级轻应用

学生体质健康测评的目的一方面是对儿童青少年学生体质健康水平的评定,重在促进其积极进行体育锻炼,最终增强体质,另一方面是运用学生体质健康测评成绩,来作为重要依据对学校体育工作情况进行评价。新中国成立以来,我国在学生体质健康测评工作上制定了一系列的制度与措施,并在21世纪初最终推行《标准》,要求每个学校每学年将学生体质健康数据进行上报,经过近二十年时间的探索,体质健康测评已经趋于完善。但就目前的体质健康测评情况来看,大部分学校的体质健康工作是为了定级而测评,花费大量的人力、物力和财力,最终将学生的体质健康测评数据进行收集并上报,重的是学生测评成绩及级别结果上报,而对于学生更为重要的评价反馈与发展应用则有不同程度的忽视,学生得到的数据评价也仅仅是简单的成绩数据而已,评价的发展性功能也就无从说起。如学生在测试过程中存在什么问题?哪项身体素质处于弱势?课程计划有无干预?就目前来看,诸如此类问题还有待评价体系的进一步完善与解决。

(二)评价对象重整体轻个人 

儿童青少年学生作为学生体质健康测评的对象,在测试的过程中往往被当作一个整体,测试过程中个人的差异性则无法完全体现。究其原因,主要是测评频次的单一。我国进行的学生体质健康测评方法是由学校统一安排测试时间,一学年进行一次,测试的时间跨度一般在1~2个星期,并根据学生测试的情况安排一次补测,为部分因特殊原因无法参加第一次的学生提供测试,并对其体质健康状况进行诊断。一学年进行1~2次测评的评价方法更加注重的是体质测试和数据收集的效率,利用收集到的数据对学生的整体体质健康状况进行定义,但这种方法忽略了测评的最初目的,即学生体质健康的诊断。因此,只有通过多次的诊断,发现学生当前的体质健康弱项与问题,并将其测评前期数据形成体质健康数据链,进而在后期的体育教学与活动中进行进一步的精准干预,才能充分发挥评价诊断的功能。信息化背景下,人脸识别、5G技术、智能可穿戴设备的快速发展,使学生体质健康测评利用信息化手段进行常态化测试成为可能,学生在不断测试评价过程中实现个体的提升,这也是未来学生体质健康测评能够破解测评频次单一的有效渠道之一。 

(三)评价内容重显现轻挖掘

《标准》中对于评价的内容(即评价指标)做了统一的规定与说明,评价的内容主要包括身体形态(身高、体重)、身体机能(肺活量)、身体素质(50米跑、立定跳远、座位体前屈等),具体见表1。

表1学生体质健康标准测试指标

              

 

 

 

 

 

 

 

 

 

 

 

 

 

测评采用统一的评价标准,学生测试完后,一方面根据每项指标的权重得到相应的总分,另一方面,根据总分的多少标记为优秀、良好、合格、不合格,教师和学校关注更多的是学生体质健康的各类达标率,注重学生体质健康显现的数据。基于大数据的新研究范式要求关注数据之间的相关性,深入挖掘数据背后的价值,而学生体质健康评价本身面对的就是学生体质健康的大量数据。因此,如何基于这些数据,运用专业的方法去挖掘学生各项数据纵向和横向的关联和规律,用于教师制订专业的运动处方,指导并干预学生的体育锻炼实践,以此来充分发挥教育评价的激励功能,这将是未来学生体质健康测评系统需要重点关注的领域。 

(四)评价方法重数值轻增值 

《标准》作为我国学校体育工作的基础性指导文件和教育质量基本标准,采用标准化的评分表对各个学段的单项指标进行了分数的划定,学生可根据单项评分表来对自身情况进行评定,各单项加权之和为其总成绩,最终以数值化的形式体现,评价的标准根据学年的增长而变化,各项成绩的加权总分进行等级确认,以此作为体质健康测评的终结。学生每年都将在学校的组织下进行体质健康测评(免测学生除外),从小学一直到大学毕业的学生自身体质健康数据形成了一个数据链。当前对于这个数据链的关注与分析,除了学生自身自然生长发育的影响因素外,对于各项数据的增值分析近乎于无,导致的结果就是学生自身成绩与往年成绩的比较与进步无法得到展现,学生体质健康各项数据进步或者是退步的幅度无法得知。造成这种局面的原因一是学生体质健康信息化管理库的缺乏,二是相关管理者数据增值意识的缺乏,在这两个方面的突破将是学生体质健康数据充分发挥作用的关键之一。 

二、学生体质健康增值性评价模型构建 

从理论层面看,增值性评价是通过对学生成绩的“进步幅度”来进行评价的,适用于学生评价的各个层面。从技术上看,增值评价可用于任何内容的评价,既可以是考试成绩,也可以是道德发展、体质健康等内容。增值性评价关注学生的发展差异,强调在过程中进行评价,打破了传统的一次性评价、终结性评价的弊端,形成了以成绩进步幅度来关注学生发展的“动态”评价。这为解决我国学生体质健康评价体系存在的问题提供了消解路径。

(一)学生体质健康增值性评价模型构建的基本原则

为确保学生体质健康增值性评价指标体系的有效性和科学性,充分发挥评价体系的导向、诊断、激励等功能,必须遵循以下四项原则。 

一是发展性原则。斯塔弗尔比姆认为评价最重要的意图是改进而不是证明。评价本身不是目的,评价的最终目的是实现学生全方位的发展。因此,增值性评价体系的确立原则之一是要从促进学生发展这个价值取向出发,扭转传统学生体质健康测评过程中只关注学生成绩和级别的价值导向。这是评价模型有效性和可靠性发挥的基本保障。 

二是个性化原则。个性化原则即要以人为本,利用教育评价的手段,引导多元主体关注个体体质健康均衡进步和增长。在增值性评价的过程中,要充分关注学生个体体质健康发展特点,尊重学生个体体质健康发展差异,公平对待各类学生,实现学生个体体质健康的均衡发展。 

三是系统性原则。系统性原则是指评价指标的全面性,既要关注学生体质健康的各项身体素质和身体机能,同时也要关注全体学生的发展水平,还要清楚地认识到,学生体质健康的发展必须遵循学生身心发展的规律,如身体素质发展的阶段性和敏感期等,在评价的过程中要系统性地进行考虑。 

四是科学性原则。科学性原则强调,在评价的过程中,要有科学的研究态度,使用科学的方法收集评价数据,使用科学的技术手段评价客观事实,尤其是在评价过程中,注重利用现代科学信息技术加强对学生全方位数据的收集,注重挖掘学生各项数据背后的相关性,为后期的运动干预提供数据基础。 

(二)学生体质健康增值性评价模型的基本框架

泰勒认为“评价过程实质上是一个确定课程与教学计划实际上达到教育目标程度的过程”,教育评价的主要过程包括制定评价指标体系、搜集评价资料、分析评价资料、进行价值判断四个部分。根据当前学生体质健康评价体系发展的现状,以及增值性评价的评价理念和价值取向,基于发展性原则、个性化原则、系统性原则、科学性原则,本研究构建学生体质健康增值性评价模型(见图1)。评价采用个体纵向发展、群体横向比较、运动干预质量三个核心指标来描述学生体质健康增值情况,根据指标体系设置阶梯层级,参照阶梯层级进行赋分,最后得到增值分数,对学生体质健康动态变化及发展过程质量作出价值判断。

1.指标内容 

一是个体纵向发展。学生个体纵向发展增值分既要考虑学生过去(上一次)体质健康测试的成绩,也要考量学生未来(回归方程预测)体质健康测试的成绩,用学生个体纵向全数据链来反映学生体质健康发展的过程。因此,纵向发展增值包括两部分:一是当前测试成绩(X2)与上一次测试成绩(X1)之差,二是当前成绩(X2)与预测成绩(X0)之差,二者共同组成学生体质健康纵向发展增值评价。实践应用当中,需要学生个体大中小学体质健康成绩形成共享机制,才能避免“各管一段”的弊端,为个体体质健康纵向发展分析提供数据链支撑。 

图1学生体质健康增值性评价模型 

二是群体横向比较。群体比较是指学生在校级群体或者区域群体中体质健康测试成绩的相对位置,用T分表示。根据学生体质健康测试数据成绩的特点,通常采用T=50+(U/6)×100进行计算,其中U是指以一批成绩的平均数为参考点,以标准差为单位来表示该成绩距离平均分的远近程度,其计算公式是u=(x-)/s,公式中,x是个体成绩,是平均数,s是标准差。将学生体质健康测试成绩原始总分进行标准分的线性转换,有助于学生了解自己在群体中测试成绩的位置,为后期进一步的运动干预奠定基础。群体横向比较要求大量准确数据作支撑,因此,建议学校或者区域相关主管部门根据需要建立信息化体质健康数据管理库,以便更加快捷准确地实现数据分析与挖掘。 

三是运动干预质量。教育评价是教育质量管理的重要活动。运动干预是根据学生体质健康纵向发展状况和横向比较情况,针对性地对某项素质制订运动处方,并由学生进行实践的过程,是学生体质健康评价体系中质量提升的关键环节。借助信息技术和网络平台系统,建立集数据收集、数据分析、数据应用为一体的常态化测试实验室,能够实现学生的发展性评价。通过一学期的运动处方实施,能够得到学生某几项素质的运动干预增值情况,假设干预前若干项素质的平均分为Y0,干预后若干项素质的平均分为Y1,Y1和Y0数值之差即为干预增值,将这部分过程性数据纳入评价体系,能够促进学生体质健康高质量发展。运动处方的制订可采取数据平台智能分析学生体质健康弱项,针对性地制订个性化处方,也可由体育教师根据学生实际情况制订相应运动处方,通过测试来诊断学生的进步程度。

2.阶梯设置 

阶梯的设置主要包括阈值的设定和层级的设定。实践过程中,阈值的设定要充分考虑评价诊断、激励和导向功能的发挥,需要科学而又艺术的处理,既能够让多数学生感受到自身体质健康的进步,又要保证评价的价值判断的准确性。阈值的设定可以根据目标导向提前设置,也可以在成绩测试过后用统计学方法来计算,还需要根据区域和学校的整体情况来判断,如体质健康水平发展不太均衡的区域与学校,横向比较的T分设置就应该大一点。本研究根据目标管理理念,采取测前设立阈值法,具体阈值见表2。层级设定即根据学生增值的阈值设定退步、稳定和进步三个级别。

表2学生体质健康增值阶梯设置 

3.层级赋分 

根据阶梯的设置,对三个指标的三个层级分别赋分,就形成了可评价的具体分值。本模型设置退步积0分,稳定积1分,进步积2分。即三项指标都进步的学生,其增值性评价分数为6分,三项指标都退步的指标其增值性评价分数为0分。实践操作当中,对各个层级赋分也可根据学校与区域的实际来权衡,如要加大对指标进步学生的褒奖程度与范围,可以将进步层级赋分的数值加大,如要加强对退步学生群体的干预力度,也可将退步层级的表现赋以负分。

4.价值判断

根据层级赋分的设置,可以用增值评价分数对学生体质健康测试成绩进行质量的评定,对于退步较多的学生要及时进行了解和干预,对于进步的学生要进行相应的褒奖。评定三个指标都稳定(积3分)或一项稳定、一项退步和一项进步(积3分)的对象为稳定,不受褒奖。三项指标增值分数之和大于等于4时,评定学生体质健康测试成绩为进步,给予褒奖。三项指标增值分数之和小于3时,评定学生体质健康测试为退步。褒奖和干预的分数临界值亦可根据实际当中教学与行政的需求进行适当调整。 

三、学生体质健康增值性评价模型的应用建议

国外对于增值性评价的理论探索源于20世纪60年代美国学者发表的《科尔曼报告》,探索的是学校效能的评价问题。伴随着不断的实践研究得以成熟,国内对于增值性评价的研究更多聚焦在增值性评价的理论探索上,由于测评技术复杂,缺乏标准性测验等原因,增值性评价本土化应用研究没有得到广泛开展,对于学生水平的增值性评价仍处于积极探索状态。本研究建立的学生体质健康增值性评价模型需要在进一步的实践应用当中不断验证和调整。 

(一)建立信息化数据库是基础 

体质健康数据库的建立是学生体质健康增值性评价模型应用的基础。数据库随着追踪年限不断增长而变得越来越庞大,信息也越来越丰富,对数据库的维护直接决定着增值性评价的效果。在实施增值性评价时,要加强数据意识,用证据说话,构建区域教育的大数据。学生体质健康增值性评价模型在应用时,要充分利用现有的体质健康数据,并不断收集学生背景、学校情况、教师信息、学生过程信息等数据,建立纵横交错的网络数据库。数据库建立的同时,还要注重体质健康智能化数据收集、数据分析、数据应用的健康管理软件开发,形成数据的可视化呈现,为后期运动处方的制订和运动干预的实施提供数据支撑。有条件的情况下还可建立常态化体质健康测验实验室,学生可根据自身情况进行多次自主测验,所得的数据为学生过程性的评价提供资料。此外,假设学生体质健康的发展是一个“斜坡”,每个学生在不同的时间都会处于斜坡的某一个点位,学生体质健康的爬坡速度可以有效衡量学校体育工作的效能,衡量爬坡速度就需要多重数据的有效支撑,多重数据的有效支撑可以建立起学生体质健康达成成就曲线图与“爬坡图”。总之,增值性评价作为一种量化评价方法,数据库的支撑是后续的评价基础。 

(二)树立增值性评价理念是关键

增值性评价的思路与理念是学生体质健康增值性评价模型应用的核心理念参考。学生增值评价应树立学生是教育的目的和归宿的理念,树立教育评价促进学生发展的思想。一种新的评价方式的产生必然引起新的教育评价改革实践,我们要关注的重点应是其隐含的评价理念。增值性评价的理念是运用学生成绩的前后差异程度来对学校、教师、学生进行评价,注重学生的差异性,关注教育评价的激励、发展功能。常规的学生体质健康评价主要关注点是学生的“及格率”“优秀率”,与《标准》制定的“教育激励”“反馈调整”“引导锻炼”三大初衷有所偏移。原本的评价方式能够在全国范围内对学生的体质健康进行总体监控与把握,但也导致了诸多问题:部分学校为片面追求体质健康“及格率”“优秀率”等指标的提升,在数据的真实性等问题上做文章;有些学生在测试成绩已经达到及格的情况下,主动放弃部分项目的测试;也有些体质健康弱势学生为了追求及格的分数,不惜铤而走险,请人代考。因此,有必要引进增值性评价与原来的评价方式形成有效的互补,增强学校体育工作的效能评价和提升学生对体质健康的内核动力,让学校重新关注学生的过程性发展,让学生增强对自身体质健康的关注。

(三)设立评价分析工具是根本

选择合理的评价分析工具是学生体质健康增值性评价模型应用的重要方法路径。模型的设计为评价提供思路,运用具体的分析工具则为大量数据的处理提供了便捷。专门的统计学分析软件将模型的思路和方法进行编程处理,实现数据处理的信息化。目前国外比较成熟的增值性评价模型有获得分数模型、协变量校正模型、马尔科夫链模型、多因变量模型、交叉分类模型等,比较成熟的相关统计学分析软件有SPSS、MLwin、HLM、MLinN、TVAAS等,这其中又以TVAAS系统应用最为成熟,TVAAS系统亦称田纳西增值性评价系统,目前,美国大部分州都在使用TVAAS系统对学生、教师、学校进行评价。需要注意的是,每类软件都有其自身的优势和局限性,需要根据评价因素水平的多少选择合适的软件分析系统,在条件允许的情况下,可根据实际需要,设计符合项目评价特征的分析软件,以取得更好的评价效果,亦可与第三方软件公司进行合作,将专业技术部分交由技术人员处理与分析。

(四)创立教育评价生态是保障

良好的教育生态评价是推动学生体质健康增值性评价落地生根的有效保障。教育评价生态是指,从评价相关因素出发,以多维结构性视角,观察教育及其相关元素的作用和运行状态。教育评价生态强调各个相关因素的有效综合,来促进教育评价整体高效能的发挥。学生体质健康增值性评价在改革实施中,需要通过分析国内外体质健康发展态势,发现评价当中存在的各类问题,综合考虑各个影响因素的作用,优化评价生态。一是增值性评价相关理念。评价理念对于评价实施有着重要的导向性作用,在学生体质健康增值新评价模型实施与应用中,应加强相关理论的研究与宣传,形成教育评价理念共识。二是评价主体的主客体。评价主客体的认知与实践对于评价生态的形成起着重要的推进作用,包括被评价的学生、评价的研究者、实施与评价的制定者,评价的主客体需要勇担自身责任与任务,保证学生体质健康增值性评价的顺利运行。三是评价的环境影响。良好的价值导向与实施的顺利运行助推评价的良性循环,良性循环的评价环境反作用于评价理念的深化与评价实施的推进,达成评价的最优运行状态。

增值性评价作为国际化研究的产物,需要理论的借鉴和实践的探索,创新和发展现有增值性评价理论和模型,形成具有中国特色的增值性评价体系,能够助力我国新时代教育评价改革的推进。本研究构建了本土化应用的学生体质健康增值性评价模型,以期能够科学而公正地评价学生体质健康发展、监控学校体育工作效能,充分促进《标准》的教育激励、反馈调整、引导锻炼功能的发挥,帮助学生在体育锻炼中享受乐趣、增强体质、健全人格、锤炼意志。新时代背景下,对学生体质健康增值性评价的探索,既是一种挑战,也是一种机遇,更是所有教育工作者的共同使命和时代担当。