新托福写作评分标准 八大批改得分要点

罗德教育国际 (罗德国际教育) 路人甲
76 0 0
发表于:2014-07-08 11:38 [只看楼主] [划词开启]
  2010年初,ETS决定对新托福[微博]写作两篇文章分别采纳“一人一机”相结合的评分方式,改变以往均由两人评分之后取其折中的评价方式。经过这样改变,新托福写作的整体得分(holistic score)是由两位阅卷人和两台机器评价综合分析而产生的。当然,考生拿到的成绩分析中会分别对综合写作(integrated writing) 及独立写作部分(independent writing)进行详细说明。其实,对于较早了解托福产品的教师来说,电脑评分系统(e-raters)已经不是什么新鲜事了。


  自从2006年新托福考试正式进入中国大陆以来,TPO(TOEFL Practice Online)逐渐在国内盛行,日益受到考生的青睐。TPO是一套在线模拟测试托福考试的系统,考生在线完成测试后,ETS会凭借网络立刻生成相应的得分及评价体系。其中作文考试就是我们所熟知的“E-raters”。可见,ETS在今年伊始采纳电脑评分作为托福写作的主要依据之一并不是“前无古人”的凭空想象,而是基于近五年研究所获得的一个结论:“机器和人工评分相结合的系统更能够真实的(realistic)、客观的(objectified)反映考生的实际交流写作(communicating essays)水平”。虽然目前从官方网页上看不到相关信息,但是这种改革已经如火如荼的展开了。这也许是ETS工作人员还不自信,希望等到测试结果令人满意才正式发布。


  电脑评分主要关注作文的哪些方面呢?


  通过对ETS官方的一些文件进行阅读分析,我们不难发现E-raters对写作的以下几个信息点非常关注:


  新托福写作批改一:语法得分(Grammar)


  ETS工作人员可以事前通过电脑程序输入写作中不同难度的语法现象及常犯的语法错误事例,因而对于考生的任何一篇文章电脑可以自动识别该习作是否犯了类似的语法错误及其是否使用了较为高级的语法现象。具体来讲,语法能力考查涵盖以下几点:动词使用是否错误、代词指代是否不明、物主代词是否使用正确、主谓是否一致、是否存在不完整句、是否存在粘连句等。毋庸置疑,电脑对于如上语法的判断要比人为操作更为严谨、准确。因为写作是依赖键盘操作,故需要对句子完整性和粘连现象进行评定。但依据笔者的经验,很多考生在短短30分钟是难以达到“语法完美”的程度的,但是他们的作文得分并不低。由此可见,虽然E-raters关注写作的语法得分,但是其重要性位阶是低于ETS 的评分原则的。


  新托福写作批改二:内容表达载体得分(usage score)


  该考查点主要关注学生能否用“较为正式的文体”来阐述自己的观点以及单词本身是否使用恰当。该评价并不关注内容是否全面、论证是否有效,而仅仅关注表达文章信息的载体语言是否满足以下几点:表达中冠词是否出现错误、是否使用不准确的词汇、单词使用形式错误(排除拼写)、比较信息表达错误、表达信息偏向口语或者不正式。这些信息点的测试也是通过ETS官方人员事先输入相应程序来实现的。通过电脑评价,这些缺憾更容易被识别,因为个人的主观见解在评分中是容易出现偏差的。但是这里需要提醒一点:我们不能把这些考点的重要性过于夸大,过于苛求我们的学生在托福作文考试中做到正式文体加正式的表达。根据赵质明校长的教学经验,虽然很多学生在托福作文中使用了诸如 “let me take an example of myself”, “okay, that's very amusing”之类非正式的语言,但是其习作依旧有可能获得满分的成绩。


  新托福写作批改三:文章文体得分(mechanic score)


  这个评分主要考查学生是否能够正确的使用英语的标点符号,是否能够满足基本的写作文体要求。具体来讲有如下几点:单词拼写、大写表达是否恰当、标点符号使用是否正确、正确的合成词使用等。一般而言,人为的评价方式对如以上项目的考查和电脑评分无异,差别并不大。由此可见,新的评分方式中加入电脑审查只不过是再次核实人为评价是否可靠、科学。


  新托福写作批改四:文章语言风格得分(style score)


  这是从表达载体的宏观角度全面衡量一篇文章的语言风格,比如:被动语态的使用、某些单词的重复现象、单词或者表达信息使用不恰当 、是否频繁使用短句或者长句等。这也就是赵质明校长上课常常给学生讲的“word and sentence variety”。这一点托福考试的关注度要远远重于能力类的考试科目。当然,这也是很多考生最难以胜任的一项。根据笔者的教学经验,很多学生虽然有好的构思和充实的论据,但是由于文章表达方式没有符合托福必备语言风格要求的能力,其独立写作仅仅只有3分。


  新托福写作批改五:文章组织架构得分(organization)


  讲的通俗一点,组织架构重点考查文章某段话内信息是否衔接得当,段落之间是否逻辑清晰,不存在重复论述的现象。也就是说,文章要让读者看起来“顺畅,不产生疑惑”。这一点正是托福考试评价原则中“coherence”的体现。此外,组织结构得分还要求考生的托福作文符合一般的论文结构,即文章有总论点、分论点及分论点展开等等。这就要求我们考生的文章结构要清晰,论点逻辑关系严谨,字数要基本符合考试要求。


  新托福写作批改六:文章论述观点展开度评价(development)


  我相信写作老师一定对development 这个能力不陌生。无论是哪一类国外考试写作部分都涵盖了对文章观点展开详细程度的考查。而这一点恰恰也是汉语文章思维和英语的最大差异之一。汉语的句子之间类似于平行结构,而英语是树状的展开架构。如果套用汉语的思维来完成托福写作,那么文章逻辑是呈跳跃式发展的,故考官读起来会比较费力气。此外,这里还存在一个问题:根据对官方文件的阅读,我们可以看到电脑评分对文章展开的审查力度是有缺憾的。电脑主要是通过对段落内部的逻辑信息表达来判断。也就是说,即使这位考生在观点后附加了评价性语言或者使用了较为充分全面的例子,但是电脑E-raters是不能判断该例证或者因果分析是否符合托福写作之“统一性”原则,即缺乏对文章信息逻辑联系是否合理、严谨的审查能力。比如学生在托福作文中出现如下类似的表达:因为我父亲在家,所以我很爱他,电脑是不能自行进行纠正的。故我们不难看出为什么ETS依旧不愿意完全舍弃主观人为因素在评阅中的积极作用。


  新托福写作批改七:语言表达难度等级评价(lexical complexity)


  一篇好的文章不仅其论述手段过人,而且语言的载体功能完美地符合论文一般性要求。所以对于考生的表达词汇难度进行评价是应有之义。简而言之,如果考生能够在文章中展现自己对词汇较为高级的驾驭能力,那么他就有可能获得较高的作文分数。比如big 和enormous两种表达,后者的难度系数要大于前者。当然,我在这里需要澄清一个误区:单词量越大,作文分数越高。在托福考试的考查原则中有一项叫做“无歧视原则”,即“托福考试中不能因为某类学生对相关学科有所了解而使得他在考试中具备有内容意义上的优势。”或者说托福考试不希望看到学生故意地在炫耀自己的词汇量。所以,我希望在教学一线的老师们不要把语言类的模板直接授予学生,这样学生就不能真正的领略什么是写作,就缺乏用自己已有的语言来写出一篇符合托福评分标准文章的意识。笔者曾经教授过一名高中生,他的单词量并不大,但是由于其文章符合评价体系最后是4分。所以我不建议考生或者是我的同事在写作课上故意炫耀自己的词汇量。当然,应对托福写作,考生应该至少具备大学四级水平的词汇量 。


  新托福写作批改八: 分论点表达能力评价(specific-topic vocabulary usage)


  这是从微观角度来衡量考生能否将其分论点阐释清晰、语言得当的标准。可以这么讲,该评价体系是对organization的细化表达,要求考生对某一个分论点进行详细的论述。需要注意一点的是:托福作文电脑评分中仅仅从单词的使用角度来考查,而没有对文章内部展开的逻辑进行验证。其原因主要是文章展开能力评测可以实现,故这里不再赘述。


  通过以上介绍,我相信读者和广大同仁对电脑评分系统有了一个梗概性的认识。简而言之,电脑评分偏重于“机械性判断”,它侧重于对文章的表面现象进行程序的逻辑认证,缺乏对文章表达内容及逻辑是否恰当的推理、验证过程 。换言之,我们的一线教师在日常教学中不必苛求学生一定要用深奥的观点或者发人深省的例子去证明前者。笔者曾经教授过一名学员,他是大学二年级学生,文章的论点不仅显得很肤浅,而且论据内容无不怪诞(主要是我上课主张学生自己编造观点及例子),但是最后该名学生依旧取得了不错的成绩。换用一句考官的话作为小结:“我们能够接受任何观点”。


  特别说明:由于各方面情况的不断调整与变化,新浪网所提供的所有考试信息仅供参考,敬请考生以权威部门公布的正式信息为准。
分类: 杂货铺

  • 0

    点赞

  • 收藏

  • 扫一扫分享朋友圈

    二维码

  • 分享

课程推荐

需要先加入社团哦

编辑标签

最多可添加10个标签,不同标签用英文逗号分开

保存

编辑官方标签

最多可添加10个官方标签,不同标签用英文逗号分开

保存
知道了

复制到我的社团