求助:怎样对语料进行洁净处理

在对收集来的语料用powergrep进行处理的时候,常用的正字表达法都有哪些。比如回车的处理,多余空格的处理等等。能不能请高手们列出一个处理的常用正字法符号组合清单,以便我们这些新手们学习和借鉴。谢谢!
 
回复: 求助:怎样对语料进行洁净处理

推荐你读一下《语料库应用研究》(卫乃兴 李文中 濮建忠 等著, 2005,上海外语教育出版社) 这本书的第二部分有对使用powergrep进行语料处理的详细讲解。
 
回复: 求助:怎样对语料进行洁净处理

记得一个c友推荐收集语料库的扫描仪?怎么找不到了呢?谢谢提供线索!
 
Back
顶部