有没有语料库能满足如下检索要求?

请问各位大侠,有没有哪个语料库可以支持以下检索要求:

比如,我想查与“目标”搭配的动词有哪些。
我希望在查找到的结果中,在包含“目标”这个词的句子中,“目标”前面一定有动词出现。

比如,附件中北京大学汉语语言学研究中心的语料库检索出来的结果包括了所有带“目标”这个词的句子,其高级检索功能也不能满足如上要求。

请各位大侠帮助。

谢谢!
 

附件

  • 2010-3-6 12-01-56.jpg
    2010-3-6 12-01-56.jpg
    161.1 KB · 浏览: 4
Last edited:
回复: 有没有语料库能满足如下检索要求?

请问各位大侠,有没有哪个语料库可以支持以下检索要求:
比如,我想查与“目标”搭配的动词有哪些。
我希望在查找到的结果中,在包含“目标”这个词的句子中,“目标”前面一定有动词出现。。。。。

你需要支持检索词性的语料库。不过,““目标”前有动词出现”,请问多前多远?

用“[v*] 目标”在“当代汉语翻译小说语料库”可以检索到“目标”前一个词为动词的结构:
瞄准 目标 2
无 目标 2
有 目标 1
失去 目标 1
缩小 目标 1
打中 目标 1
偏离 目标 1
到 目标 1
奋斗 目标 1
(注意有些是分词和词性标注错误)

[v*] * 目标”可以检索到“目标”前第二个词是动词的结构:
追求 的 目标 2
漫 无 目标 2
达 到 目标 1
瞄准 了 目标 1
能 打中 目标 1
没有 什么 目标 1
确定 的 目标 1
注意 的 目标 1
偏离 这个 目标 1
转移 了 目标 1
关注 的 目标 1
攻击 的 目标 1
(注意有些是分词和词性标注错误)

依此类推,“[v*] * * 目标”得到“目标”前第三个词为动词的结构:
看 不 清 目标 1
是 攻击 的 目标 1
纠缠 等等 的 目标 1
看不到 的 远方 目标 1
是 我 的 目标 1

只是很可惜,这个语料库就你的研究目的来说还是小了点。
 
Last edited:
回复: 有没有语料库能满足如下检索要求?

Xaira's Query Builder function can do that as long as you have access to an XML version of POS tagged Chinese corpus like LCMC or UCLA Written Chinese. For example, in LCMC there are 250 lines that meet your requirements.

You can also use the Collocation function in Xaira to extract statistically significant verb collocations.
 
回复: 有没有语料库能满足如下检索要求?

谢谢LAOHONG和XIAOZ的热心回复。正在研究中。
 
回复: 有没有语料库能满足如下检索要求?

Xiaoz推荐Xaira有些道理,Xaira里的Query Builder是可以做到这样的检索,但是也有几个问题。一是Xaria处理语料时非常buggy,要求用户要有很大的耐心和自己解决问题的能力;二是Query Builder对大多数人来说用起来不易,就我了解,这里除了肖博士和我本人之外似乎还没有人常用到它;三是Xaira索引好的、公开免费使用的语料库还是很少的, 汉语的除了LCMC和UCLAWC外,似乎没有别的了。

因此,基于web的检索会更方便普通用户的。最近打算把LCMCUCLAWCCCTFC汇集到一个检索界面里,这样库容应该足以满足一般检索的要求了,至少“目标”的结果就可达到294 + 74 + 45 = 413 了。
 
回复: 有没有语料库能满足如下检索要求?

同意老洪的说法,我很不喜欢Xaira。

能将三个汉语语料库结合到一个界面,是个不错的想法。
 
Back
顶部