PTE业界最深度剖析!评分机制大公开!



很多小伙伴都会问驼驼
一些关于评分机制的问题
“驼驼,各个题型的占分比是怎样的哇”
“背了机经就能八炸嘛?”
“遇到难题分数反而容易高么?但是我又听说题目难分数就低”
“考试的评分机制究竟是怎样的
......
教研大大们为了解答各位学员的疑惑
收集了一整个月的素材
去考场测试了8次
利用模考C卷测试了6次
给大家整理了下面的干货
我们一起来康康吧~


1、背机经产生的影响会比常规考试(例如高考)大。


对于词汇比较难的题,提前背好机经很容易和没背机经的同学拉开差距。因为词汇比较难的题有着更高的难度系数(Diffilcult Level)。


同时,在正态分布中,由于机经的影响也让数据更加离散,特别是对于难题考生间更容易拉开差距。正式考试时,你写下来机经上的一部分内容就能拿到高分,所以建议考生可以多刷刷机经。(PS:羊驼APP上面就有机经全库,还有命中率高达90%的周更高频机经哦~)



2、每个题型的分数都是不确定的,之前网上流传的每个题型的数值都不准确。


之前有的机构说,测试了只做WFD,发现给写作贡献48分,听力贡献27分(这个和我们测试的结果一样),就断言WFD的写作占比是48/90,听力占比是27/90,这样是非常不科学的。


这只是一个大概的数值。并且在不同的分数段,每种题型提供的分值是会变化的。至于为什么显示的成绩会给写作贡献这么多,数学好的同学读完本文就知道了。




3、你拿到分数和题目的难易无关。


因为简单的题目更难得分,难的题目更容易得分,这样一来就抵消了题目的难度阻力。举一个极端的例子,如果一个考生发挥极其稳定,他做难题和简单题得到的分数是分毫不差的。



PTE考试不是打副本,而是一场排位赛

我们的高考是每个题题目都有固定的分数。比如,你错3个英语单选题,你就在英语总分里面被扣了3分,扣的分数非常固定,我们把这种评分机制叫做标准参照评价。
        
比如某一年湖南省的高考题目很难,考生群体的分数就会相对上一年度明显下降。但是,是不是大家分数都不高,就没人能考上清华了呢?肯定不是,清华的分数线也会随之下降。反之,则会水涨船高。

PTE成绩单的分数,就像学校的分数线,是会随着难易变化的。举一个极端的例子,假设其他所有考生的PTE原始分都只有1分,只有你考了2分,那你就是PTE满分90分。

你能不能够进清华,是你在当年高考全省的排名决定的。同样的,你的PTE成绩是多少,则是你在所有考生中的排名决定的。

所以,你在PTE考生中的排名就是你的分数,PTE是一场排位赛。



PTE评分机制的一些细节


在之前的文章里面,跟大家提到过正态分布。这次详细一点儿说:PTE的考试分数服从的正态分布的规律。大致如下图:

                  


Sco=final score(最终分数)
X=Raw Score(原始分数)
Mean=样本均值
SD=Standard Diviation=标准差
S=相关系数 
D=均值

简而言之,μ就是公式中的均值,可以改变整个正态分布的横向位置。σ就是公式中的standard diviation,在统计学中代表整个大样本的离散程度。


以上公式很复杂,这里略过10000字。具体的原理,教研大大说可以等羊驼开设统计学专门课程再跟大家细聊。在这里,只说PTE官方模考给我们提供的两个证据。


写作只做WE, Writing 有31分。只做WFD, Writing 有48分。WFD+ SWT一起做,Writing 却只有54分。


RS+WFD都做好=53分listening。RS说一半+WFD做好=49分listening。RS在口语中的占比比较大,只做一半,少说了那么多词,却只扣4分。


所以,每个题型的得分不是1+1=2的简单相加,而是1+1<2的复杂算法



另外一个重要的引申


             

本图为了更形象,特意把斜率画得比较明显,实际上的斜率没这么夸张。


让我们做一个思想实验。假设,一个同学从零基础,在学习中稳步提升各个题目准确率(有点像牛顿力学实验的匀速直线运动的理想状态,该同学从0分-30分提升是比较快的,40-60则是一个瓶颈期,提升较慢因为大部分考生都在这个区间,要超越很多人才能提升一分),70-90提升则相对来说比较快。


注意,这是一个理想的状态,并且提升速度的差别可能较小,但是确实会有分数段不同而造成区别。实际情况会有其他更大的影响因素,比如,要考79分会牵涉到高难度低分值题型的攻克、重要题型的精益求精,所以一般情况下还是建议头悬梁锥刺股啃机经,并且获取外部的帮助



推荐