我想用WORDSMITH 4.0 ,语料库是BNC(光盘版)的, WORDSMITH不是要求文件都是要UNICODE吗, 那应该怎么样把BNC中的语料转为符合WORDSMITH要求的文件类型呢? 谢谢各位
同意。WS检索BNC的时候,如果没有去码,就会保留附码,选ignore与否并不能消除这些码。论坛上有如何去码的办法,自己找吧。字母文字绝大多数都在unicode之列了,这个不用担心。
前一阵子听说把BNC中的附码去掉花了好大功夫,恐怕不是很轻易就可以做到的。如果有什么简便易行的方法,不妨说来听听,谢谢了。