※ 引述《brightroad (哈哈)》之銘言:
: http://www.ets.org/portal/site/ets/menuitem.1488512ecfd5b8849a77b13bc3921509/?
: vgnextoid=302433c7f00c5010VgnVCM10000022f95190RCRD&vgnextchannel=7196e3b5f64f4
: 010VgnVCM10000022f95190RCRD
: How are the sections of the General Test scored?
: Note: In the fourth quarter of 2008, the GRE Program expects to implement
: e-rater scoring technology in the scoring process for the computer-based GRE
: Analytical Writing section. E-rater is a computerized natural
: language-processing program developed by ETS. The scoring process described
: in the paper-based Analytical Writing section will be in effect for the
: scoring of both the computer-based and paper-based Analytical Writing section
: until e-rater is implemented.
: Analytic Scoring of TOEFL CBT Essays: Scores From Humans and E-rater
: www.ets.org/Media/Research/pdf/RR-08-01.pdf
我大致看完了這一篇paper.
ETS各項考試的作文(包括TOEFL,GRE,GMAT)都使用"e-rater"電腦軟體評分,
這份報告明白指出"ETS沒有使用人工閱卷".
然而這篇研究的重點是比較二種電腦閱卷模式的優劣: Holistic and Analytic.
ETS所使用的"e-rater"軟體是採用後者.
針對TOEFL作文,"e-rater"有多達50項以上的評分指標,但主要可以分成12大項,
在第9頁有說明. 我只列出單字的部份:
Lexical sophistication
Type/token ratio 特殊字(unique words)佔全部字數的比例
Word length 字的平均長度
Vocabulary level 字的等級.
由此可知,所有的評分標準都是由電腦計算統計出來的, 就單字而言,
使用越多特殊的,稀有的單字, 以及很長的,難度高的單字,就可以拿到高分.
另外,像是文法錯誤次數,文章長度等,也都是評分標準.
e-rater還會對照範文(sample essays),比較考生文章和範文之間的差異性,
換句話說,越接近範文格式的文章,分數自然也就越高.
以上是大略內容. 有興趣的人可以參考看看^^""
--
: http://www.ets.org/portal/site/ets/menuitem.1488512ecfd5b8849a77b13bc3921509/?
: vgnextoid=302433c7f00c5010VgnVCM10000022f95190RCRD&vgnextchannel=7196e3b5f64f4
: 010VgnVCM10000022f95190RCRD
: How are the sections of the General Test scored?
: Note: In the fourth quarter of 2008, the GRE Program expects to implement
: e-rater scoring technology in the scoring process for the computer-based GRE
: Analytical Writing section. E-rater is a computerized natural
: language-processing program developed by ETS. The scoring process described
: in the paper-based Analytical Writing section will be in effect for the
: scoring of both the computer-based and paper-based Analytical Writing section
: until e-rater is implemented.
: Analytic Scoring of TOEFL CBT Essays: Scores From Humans and E-rater
: www.ets.org/Media/Research/pdf/RR-08-01.pdf
我大致看完了這一篇paper.
ETS各項考試的作文(包括TOEFL,GRE,GMAT)都使用"e-rater"電腦軟體評分,
這份報告明白指出"ETS沒有使用人工閱卷".
然而這篇研究的重點是比較二種電腦閱卷模式的優劣: Holistic and Analytic.
ETS所使用的"e-rater"軟體是採用後者.
針對TOEFL作文,"e-rater"有多達50項以上的評分指標,但主要可以分成12大項,
在第9頁有說明. 我只列出單字的部份:
Lexical sophistication
Type/token ratio 特殊字(unique words)佔全部字數的比例
Word length 字的平均長度
Vocabulary level 字的等級.
由此可知,所有的評分標準都是由電腦計算統計出來的, 就單字而言,
使用越多特殊的,稀有的單字, 以及很長的,難度高的單字,就可以拿到高分.
另外,像是文法錯誤次數,文章長度等,也都是評分標準.
e-rater還會對照範文(sample essays),比較考生文章和範文之間的差異性,
換句話說,越接近範文格式的文章,分數自然也就越高.
以上是大略內容. 有興趣的人可以參考看看^^""
--
All Comments