「随笔」教育的测量难题
教育测量是个难题,根源在教育与测量的矛盾。试图只靠数字量化来衡量教育及相关师生的水平和质量,这本身就是无视教育科学的做法。
每当职评,学校总会面临技术难题,不同学科教师的评价,难以用统一的量化积分衡量。涉及非高考科目如此,即便是高考科目,也难说用考试成绩就能对不同学科的教师进行科学的评价。
2017年高考,语文试卷取消了试行几年的文学类和实用类的选考题,就是因为无法平衡两类试题的难度,趋利避害的考生当然要选考不喜欢但易得分的实用类文本阅读而放弃感兴趣但难得分的文学类文本阅读。选考试验的失败,根本原因在于想用分数来衡量考生兴趣爱好的高下,此路不通。于是只好回到正途,同题比较,文学类跟文学类比,实用类跟实用类比。
在高考作文阅卷中,同一作文题下,记叙文、议论文之间同样无法给出科学的统一评价标准。因此高考北京卷把不同文体的写作放在不同的题目中考查,也是对教育科学的尊重。
人的个体有差异,兴趣无高下。数字往往分高下,而教育常常看特色。把钢琴王子和短跑飞人拉到同一赛场,评委统一打分评出冠亚军,没人会这么做,但教育领域这样令人啼笑皆非的事却并不罕见。语文成绩与数学成绩的简单对比、语文优质课与数学优质课的混组打分,都是不尊重教育常识和教学规律的做法。
有时候我们看到统考的成绩排名,一二百人的平均分数与一两千人的平均分数混在一个统计表中,起点差异很大的不同学校的成绩混在一个统计表中,大家一起比来比去,习以为常。当校内班级比较时,我们都懂得国际班与普通班不能用同一标准比较,实验班与普通班也不能用同一标准比较,但是上述情况却总是熟视无睹,岂不怪哉。
从这个角度看,浙江英语赋分调整风波折射的不仅是傲慢的权力与汹涌的民意的冲突,更是是教育与数据的深层矛盾。