It's a nice corpus. Could you please introduce more about its data---such as what textbooks they actually are? Thank you so much.
下面三个文本的教材名标注出错(每个文件的第9行):
C1IN0602.txt
c2fa0013.txt
C3IN0701.txt
库很好啊,这样的东西都教学非常有帮助,感谢分享。哪位朋友还知道哪里有 cet4,6 and TEM-4,8 的corpus?感谢了
这样东西听说已经有了。所以自己就没动手去建。因为如果有成型的东西,自己再去建也弄不出什么新东西来。不过如果自己建立的话,感觉上难度不是特别大。因为语料的来源很可靠,是固定的试卷。网上都有,不需要自己手动去key into。所以,相对来说,我感觉只要用点心,应该是说的过去的。而且如果只是自己用的话,就可以更rough一点。但还是感谢有谁能提供专业的建立好的这个方面的库的资源或联系方式。