求各路高人帮帮晚辈:
本人论文需建立红楼梦英文版小说语料库,现已下载了word版本,并将其粘入text。在用antconc 进行关键词检索时,检索结果页面出现好多乱码。
致电给导师后,说需要文本预处理,但是怎么预处理,本人不懂啊!!!!!
谁能帮帮我啊,或者谁有建好的英文红楼梦语料库,可否分享一下呢?



本人论文需建立红楼梦英文版小说语料库,现已下载了word版本,并将其粘入text。在用antconc 进行关键词检索时,检索结果页面出现好多乱码。
致电给导师后,说需要文本预处理,但是怎么预处理,本人不懂啊!!!!!
谁能帮帮我啊,或者谁有建好的英文红楼梦语料库,可否分享一下呢?