请问各位论坛大侠们,我建了一个很小的专业英语语料库,为什么wordsmith做wordlist,文本(txt)里的数字都显示成了#? 然后frequency就很高,排第四,严重影响我后面做keyword list的结果, 我也试unicode格式,也不行,请教一下怎么解决这个问题呢?
另外,我想the Bank of English做reference corpus, 请问哪里可以获取它的wordlist啊?我只在网上找到了the BNC的,可是我的库里有American, British and Autralian Englishes.
在此先谢谢大家