太了解我了。。多的话数据分析处理不来,少的话有些数据出不来。。多了嫌多,少了不够,哈哈
BNC和COCA那些的词量都太大了,一个词就有上万个token,我想研究逻辑连接词,有近一百个词要研究,太大的语料库反而我自己处理不来啊。为什么 50 万词?这个看上去很奇怪
谢谢你的建议。我之前想研究COCA中的逻辑连接词的使用情况,并和SECCL中的情况作对比,COCA和BNC一样容量很大,但我发现语料库太大,我反倒分析处理不来,所以我才想换语料库。不知道你有什么其他不太大的native口语语料库的建议?在线的BNC有1000万口语,COLT含在其中。
http://corpus.byu.edu/bnc/
谢谢你的建议。我之前想研究COCA中的逻辑连接词的使用情况,并和SECCL中的情况作对比,COCA和BNC一样容量很大,但我发现语料库太大,我反倒分析处理不来,所以我才想换语料库。不知道你有什么其他不太大的native口语语料库的建议?