菜鸟请教各位老师语用标注的问题,急!

我想自建两个可比语料库研究不同类型的拒绝言语行为在中美电视剧中出现的频率,已经搜集了剧本,英汉各2,000,000字,WORD格式储存。这些剧本我都看了,并用不同字体将不同拒绝言语行为标出来了。请问我在将他们放入语料库之前该如何对这些拒绝言语行为进行标注呢?谢谢!
 
回复: 菜鸟请教各位老师语用标注的问题,急!

可先定义各不同类别的代码,然后用word的替换功能,将特定字体的部分替换为特定代码,比如<typea>...</typea>
之后将word文本保存为txt,就可以检索了
 
回复: 菜鸟请教各位老师语用标注的问题,急!

Replace 两位大师 with 两位。
 
Back
顶部