今年高考作文题有多失败 唐映红① 每年高考,被吐槽最多的恐怕就数第一天语文考试科目的作文题。几乎每年各省高考作文题一公布,调侃、讽刺和批评作文题目的文章或段子就开始流传。今年也不例外。 昨天上午语文科目考试一结束没多久,各省语文科目考试的作文题就很快成为新闻热点。去年高考作文题公布后,我曾经写过一篇文章来批评高考作文考试,《高考作文一直都是失败的考试》。认为从心理测量学的角度,高考作文考试既缺乏信度,也缺乏效度。命题人既要避免被押中考题而偏偏不循常理思考,又要通过考题彰显和引导考生意识形态的“先进性”与“正确性”,导致每年频频出现缺乏现实性和生态意义的偏题、怪题。阅卷老师的偏见和价值倾向性直接影响了对考生的作文评分。更重要的是,无论中学写作训练还是高考作文考试,反映的往往不是考生的写作能力,而更多的是考生对僵化语文教育体制的适应水平。 设计一种技术上成功的考试,从心理测量学角度,必须满足三个基本的要素:效度、信度和标准化。 所谓效度,也即是考试的题目是否反映了通过考试想了解的学生能力或知识掌握方面,如果考题所能够反映的能力或知识掌握,与试图通过考试想了解的不一致,那么就是一门低效度的考试。 所谓信度,指的是一种考试的稳定性、一致性及可靠性。稳定性高的考试,每一次考试都能得到相对稳定的考试结果;一致性高的考试,无论是哪个阅卷老师按要求评阅出来的分数应该大体一致;可靠性高的考试,考生不同时候来接受测试应该得到大体相似的分数反映。 所谓标准化,则要求考试题目设计含义清晰,既不能模糊,也不能引发歧义。标准化的题目应当使所有考生都能清楚明白题目要求,并能按照题目要求作答;同时,标准化的题目应当有标准化的评分手册,使所有阅卷人能清楚明白且理解无误地遵循同等的评分标准和尺度。 如果一个考试既缺乏必要的效度,也缺乏必要的信度,题目和评阅也缺乏标准化的起码要求,那么就可以从心理测量学角度来判断这是一个失败的考试。如果仅仅满足于能够将考生甄别开来,那么抛硬币也能有效地把考生甄别为“合格”、“不合格”两类,而且后者不仅简单、便宜,而且相当“公平”。一个在心理测量学上失败的考试,其效用与抛硬币没有本质的区别。 高考作文考试,试图通过命题作文来了解考生的思考、分析能力,以及语言表达、思维缜密、阅读积累等综合能力,那么作文命题能够反映出来的考生能力是否就是希望了解到的能力呢?这就是所谓的效度问题。一般来说,写作可以粗略地分为应用文的写作和文学的写作,前者要求使用精准的语言和有效的逻辑以使文章清晰明了;后者则要求想象力和创造性的文字表达能力。事实上,经过高中语文教育,以及在高考作文考试中取得较好的分数的大学生中,仍然有相当比例的学生写作既缺乏逻辑,也缺乏想象,凭此难以认可高考作文考试是一种有效的考试。 高考作文命题往往具有极大的偶然性而非普适性,能写好去年度的高考作文命题,不见得能写好今年度的命题;能写好四川省的命题,未必能写好上海市的命题。高考作文常常出现某一篇考生作文,不同阅卷教师评分,从近乎零分的低分到接近满分的高分,完全是天壤之别。同时,由于高考作文命题的审题常常主观设定所谓的“正确性”标准,而这个标准又与特异性的情境命题有关,缺乏内在逻辑的一致性,出题人对审题、立意的设定常常相互矛盾,考生揣摩到命题人思路,则容易得高分;揣摩错命题人思路,则容易得低分。因此,无论从稳定性、一致性还是可靠性角度,高考作文都是明显缺乏必要信度的一种考试。 下面,尝试用心理测量学的这三个指标来衡量,今年度的高考作文题有多失败。如果说“失败”是令人不悦的“负能量”;那么,也可以看看今年度的高考作文题有多成功。需要说明的是,下面的评判仅仅针对作文考试题目,不能完全反映整个高考作文考试。衡量考试的成败,需要从题目、施测、评阅三个维度来综合考察。高考在施测这个维度上没有什么问题,而评阅暂时处于保密阶段,只有题目是可以评价、衡量的。一般来说,题目是三个维度中最重要的,题目失败,那基本上考试就失败;而题目成功,考试则未必成功,还需要评价施测、评阅两个方面。 相关的指标含义如下: ★★★★★:成功的题目。在效度和信度以及标准化方面没有明显的瑕疵。(注意,不是无懈可击) ★★★★:比较成功的题目。在效度、信度和标准化方面只有不明显的瑕疵,或者只有其中一个方面有较明显的问题。 ★★★:不算成功,但也谈不上失败的题目。有明显的错误,但尚算得上及格。 ★★:比较失败的题目。至少在效度、信度和标准化中的两个方面存在明显的错误,且比较严重。 ★:失败的题目。存在硬伤且在效度、信度和标准化方面存在严重问题。 1、 全国卷新课标Ⅰ 作文题目:给违反交规父亲的一封信。★★ 点评:之所以评判为比较失败的题目,就在于作文材料是一起极具争议性的事件,考生的态度倾向如果与命题人或评阅人不符,将可能导致明显丢分。将即使在专家层面也众说纷纭的社会争议事件作为作文命题的材料,既不专业也不严谨。考试结束后举报人惨遭人肉搜索。 2、全国卷新课标Ⅱ 作文题目:三个人谁最有风采★★★★ 点评:从题目提供的材料看不出命题人的倾向性,因此,考生需要选择自己的观点,并作文。这算得上比较成功的题目。题目没有歧义,考生理解起来比较容易,同时评阅老师也不容易有预设立场,相对而言能比较针对学生的思考和文字评判,而不是学生的态度。 3、北京卷 作文题目:自选一位中华英雄,展开想象,叙述你和他(她)在一起的故事。或深入灵魂的热爱。(二选一)★★ 点评:两个题目都比较失败。第一个题目本身已经限制和设定了学生的态度选择和思考,不难想象如果一个考生通过想象写出一个解构英雄的故事,哪怕思考和文字一流,也很可能成为传说中的零分作文。这个题目与其说是考察学生的写作,不如说是甄别考生的态度和立场。第二个题目令人费解。不是每一个人都有“深入灵魂的热爱”,题目的设定已经意味着大量考生需要编造这种“热爱”来敷衍行文。如果单独评判,两个题目分别都只应该★;好在提供了二选一,考生起码可以两害相比取其轻者,所以★+★。 4、天津卷 作文题目:范儿②。★★ 点评:“范儿”是一个北京方言词,对熟悉北方语言的考生或许理解起来没有问题,但对南方考生则存在理解上的费劲。由于题目设计太过开放,考生揣摩题意容易出现发生分歧,很难想象命题人和评阅人能有相对一致的评阅标准和尺度。这种题出现同一份作文不同老师评出悬殊的分数不足为奇,问题出在命题上。 5、上海卷 作文题目:人心的坚硬和柔软★ 点评:用比喻来命题本身就极不严谨。人心的“坚硬”与“柔软”本来就因人而宜,人言人殊;题目抛出的观点“如何对待它们,将关系到能否造就和谐的自我”则根本就缺乏逻辑,只是命题人自以为是的武断结论,既缺乏普适性,也不符合生活常识。难以理解这样的题目会用来影响甚至决定数以十万计的考生前程。 (节选自腾讯《大家》,2015/6/9) 相关链接: ①唐映红,腾讯·大家专栏作者,高校心理学教师,自由撰稿人,从事心理学科普写作。 ②《我的范儿》范冰冰李晨中枪,2015高考语文首个高考0分作文。据现场监考老师口述,一名长相憨厚的男生写出了如下文字。老师还私下表示,从未见过如此意淫的文章,虽然脑洞开得很大,但依旧还是给零分。 ③据参加过多年高考阅卷工作的李老师透露,高考阅卷量大,阅卷时间长,但平均起来(用语文作文示例)教师停留的时间大约5秒。 (1) 从心理测量学的角度,高考作文考试既缺乏信度,也缺乏效度。试结合文章内容简述其原因。(6分) (2)在文中提到的5类试卷中,作者认为2015年命题比较失败的作文有哪些?任选其中一类试卷,简要分析“比较失败的作文”的原因。(5分) (3) 结合文本内容,请从效度、信度和标准化角度论述“一个在心理测量学上失败的考试,其效用与抛硬币没有本质的区别”的合理性。(6分) (4)通读全文联系实际,如何才能使高考作文的命题走向成功?(8分) 【参考答案】 1. ①社会十分关注。语文科目考试一结束没多久,各省语文科目考试的作文题就很快成为新闻热点。②命题人既要避免被押中考题而偏偏不循常理思考,又要通过考题彰显和引导考生意识形态的“先进性”与“正确性”,导致每年频频出现缺乏现实性和生态意义的偏题、怪题。 ③阅卷老师的偏见和价值倾向性直接影响了对考生的作文评分。无论中学写作训练还是高考作文考试,反映的往往不是考生的写作能力,而更多的是考生对僵化语文教育体制的适应水平。(每点2分,6分) 2. 天津卷、北京卷、全国新课标1(1分)。 示例:选择全国新课标1,①衡量考试的成败,需要从题目、施测、评阅三个维度来综合考察。在效度、信度和标准化中的两个方面存在明显的错误,且比较严重。②全国新课标1作文材料是一起极具争议性的事件,考生的态度倾向如果与命题人或评阅人不符,将可能导致明显丢分,且变化较大,书信替换了十几年的议论文。(4分) 3. ①设计一种技术上成功的考试,必须满足三个基本的要素:效度、信度和标准化。考试的题目是否反映了通过考试想了解的学生能力或知识掌握方面,评卷要标准,试题要标准。 ②通过命题作文来了解考生的思考、分析能力,以及语言表达、思维缜密、阅读积累等综合能力,达到作文命题能够反映出来的考生能力正是希望了解到的能力。 ③高考作文得分具有偶然性。命题的审题常常主观设定所谓的“正确性”标准,标准缺乏内在逻辑的一致性,出题人对审题、立意的设定常常相互矛盾,考生揣摩到命题人思路,则容易得高分;揣摩错命题人思路,则容易得低分。(6分) 4.①信度与效度兼具;考题既要能够反映的能力或知识掌握,又要有一致性、可靠性。考试题目设计含义清晰,既不能模糊,也不能引发歧义。 ②改变教育体制,克服高考制度的短板。不同阅卷教师评分,从近乎零分的低分到接近满分的高分,完全是天壤之别,降低得分偶然性。 ③跨科合作,对学术用语做到准确无误。比喻来命题本身就极不严谨。人心的“坚硬”与“柔软”本来就因人而宜,人言人殊。方言尽量不要出现在试题中。 ④高考阅卷量大,阅卷时间长,阅卷人应不求快,只求稳、准、真,得分切合考生实际水平。(8分,每点2分) |