菜鸟请教如何检索

请教如何检索V上

最近想做一个研究,研究V上这种趋向动词,比如爬上、撞上之类的
在语料库怎么检索才能得到这类词呢?北大语料库里无法输表达式啊。
另外兰开斯特汉语语料库和北大的语料库哪个好?
求救啊 呵呵
 
Last edited:
回复: 菜鸟请教如何检索

我能想到的是先输出所有检索结果,然后再手动分类...估计要累死...
再请版上高人指点吧。
 
回复: 菜鸟请教如何检索

我能想到的是先输出所有检索结果,然后再手动分类...估计要累死...
再请版上高人指点吧。

恩 恩 语料几十万条 手工分类太痛苦了 有哪个高手可以帮帮我呢 写论文急需解决的问题呀。
 
回复: 菜鸟请教如何检索

要是我就这么做:
1 CCL检索所有的带“上”的语料索引行,左右设定大一些,比如1000.(设定1000表示你一定要它整句话!语境完整分词时会更准确。)
下载所得。存为txt.(自动的。)
2 把这个文本进行词性标注,(中科院ICTCLAS 2010)比较好。Kevin Zhang 有博客。
3 再在自己的机子上重新检索(最好用正则) “ \b\w+_v\s上 ”。意思是只查找动词(一个字以上的动词)后跟“上”字的。(我这个正则是Kevin Zhang的分词后修改过斜杠的。如果你什么都不改动,见下面的正则)。看你用什么检索软件才能确定表达式。有的可能是连字符后面加词性标注。有的是斜杠。

我下面的图用的Wordsmith,它自动按词类分开了上下几块。Antconc也行,表达式“ \b\w+/v\s上 ”。你试一试。本站有帖子告诉你Antconc 里global setting的事,有2项很重要必须设定才可以处理中文。
 
Last edited:
Back
顶部