关于用BNC做reference corpus的问题

xujiajin

管理员
Staff member
Posted by rosezhou1
我想做关于中国英语变体(书面语)在概念层的变异特征,打算自建去除了口语的BNC子语料库为参照语料库,但看到国内外关于英语变体研究普遍都是用包括口语和书面语的参照语料库如BNC,ICE,那么我是否也可以直接使用BNC?还有必要自建参照语料库吗?谢谢!
 
回复: 关于用BNC做reference corpus的问题

严格来讲,应去除BNC中1000万词的口语语料。可用BNC indexer得到书面语文件名。

ICE里更是有近60%的口语语料。ICE-CUP工具里应该有导出工具,但貌似非常复杂。
 
Back
顶部