CEM上海外语教育出版社出版
一些文章中提到该语料库总共收录了2004到2006年四、八级考试作文共2400篇,八级考试翻译(汉译英)共2000篇。
但我仔细查看了一下,文本实际包括: 作文2518篇(八级1111, 四级1407篇), 翻译1911篇=4429篇
我删除了分数为0内容空白的语料(真搞不懂为什么空白的也要加进去), 总共还有4409篇.tem4: 1403 tem8:1111 tem8trans:1895.
好像还有作为写了很长,但得分为0的,可能是直接从试卷上抄了一篇文章的,那样的放在这里有意义吗?
希望大家能帮我确认一下.
一些文章中提到该语料库总共收录了2004到2006年四、八级考试作文共2400篇,八级考试翻译(汉译英)共2000篇。
但我仔细查看了一下,文本实际包括: 作文2518篇(八级1111, 四级1407篇), 翻译1911篇=4429篇
我删除了分数为0内容空白的语料(真搞不懂为什么空白的也要加进去), 总共还有4409篇.tem4: 1403 tem8:1111 tem8trans:1895.
好像还有作为写了很长,但得分为0的,可能是直接从试卷上抄了一篇文章的,那样的放在这里有意义吗?
希望大家能帮我确认一下.