LOCNESS语料库的替代品NESSIE语料库
NESSIE Corpus Version 1
(Native English Speakers' Similarly- and Identically-prompted Essays, Version 1, October 2, 2012)
NESSIE corpus 1.0版是一个18万词次左右规模的英美本族语者英语作文语料库。其中所收文本主要是英美本族语者依照中国四六级、四八级作文题所撰写的英语作文。也有部分语料文本取自BAWE、MICSUP等英美大学生语料库中话题近似的文本。创建NESSIE语料库的主要考虑是,很多国内语料库研究者没法得到LOCNESS语料库。另外,LOCNESS中所收文本的作文题与中国大学生所写的作文题差异巨大,因而不具很好的可比性。
目前NESSIE语料库中的一部分语料文本还没有得到版权所有者的许可(我们正在联系相关人士,主要是一些在华外教),所以没法提供所有语料库文本的下载。现在大家可以通过我们的在线检索系统BFSU CQPweb全文检索,计算搭配、生成词频表和主题词表等。应能满足大家的常见研究需求。
NESSIE语料库这次发布的是1.0版,我们还会进一步扩大语料库规模。待完成后再公布。
请在http://111.200.194.212/cqp/上找到
NESSIE corpus version 1 (Native English Speakers' Essays)
用用户名:test和密码:test访问。
附:LOCNESS的介绍
http://www.uclouvain.be/cps/ucl/doc/cecl/documents/LOCNESS.doc
NESSIE语料库的详细documentation等我写好后,再上传到这里来。
NESSIE Corpus Version 1
(Native English Speakers' Similarly- and Identically-prompted Essays, Version 1, October 2, 2012)
NESSIE corpus 1.0版是一个18万词次左右规模的英美本族语者英语作文语料库。其中所收文本主要是英美本族语者依照中国四六级、四八级作文题所撰写的英语作文。也有部分语料文本取自BAWE、MICSUP等英美大学生语料库中话题近似的文本。创建NESSIE语料库的主要考虑是,很多国内语料库研究者没法得到LOCNESS语料库。另外,LOCNESS中所收文本的作文题与中国大学生所写的作文题差异巨大,因而不具很好的可比性。
目前NESSIE语料库中的一部分语料文本还没有得到版权所有者的许可(我们正在联系相关人士,主要是一些在华外教),所以没法提供所有语料库文本的下载。现在大家可以通过我们的在线检索系统BFSU CQPweb全文检索,计算搭配、生成词频表和主题词表等。应能满足大家的常见研究需求。
NESSIE语料库这次发布的是1.0版,我们还会进一步扩大语料库规模。待完成后再公布。
请在http://111.200.194.212/cqp/上找到
NESSIE corpus version 1 (Native English Speakers' Essays)
用用户名:test和密码:test访问。
附:LOCNESS的介绍
http://www.uclouvain.be/cps/ucl/doc/cecl/documents/LOCNESS.doc
NESSIE语料库的详细documentation等我写好后,再上传到这里来。
Last edited: