[求助]有什么软件可以提取语料库中所有的搭配形式

emily

初级会员
刚刚看了一些台湾学生研究搭配的习作,对搭配进行统计都是作者人工完成的。

请问如果对一个稍大一点的语料库进行搭配统计的话是否有什么软件可以帮助提取所有的搭配形式呢?然后再对其中的搭配进行正误归类,总结使用特点呢?比如说CLEC,对搭配所总结的六种错误搭配类型难道也是人工完成的么?

(green hand)
 
回复:[求助]有什么软件可以提取语料库中所有的搭配形式

以下是引用 emily2006-3-23 23:26:26 的发言:
刚刚看了一些台湾学生研究搭配的习作,对搭配进行统计都是作者人工完成的。

请问如果对一个稍大一点的语料库进行搭配统计的话是否有什么软件可以帮助提取所有的搭配形式呢?然后再对其中的搭配进行正误归类,总结使用特点呢?比如说CLEC,对搭配所总结的六种错误搭配类型难道也是人工完成的么?

(green hand)
你这里问的是两个问题。如果是统计某个特定的词/词串的搭配,可以用concordance列出再统,当然,这好像是没有目标地统计,也许你要统计某一具体类型的搭配,在tagged语料库中,可以通过检索tag来统计。CLEC中的搭配错误分类是通过人工标注的,完成了标注,如果标注一致,研究者们再统计就会方便了。
 
首先谢谢 oscar3 的答复。
如果是在一个tagged语料库中我想统计所有的动名搭配,那用什么软件来统计呢?如何通过检索tag来统计,希望能得到更加详尽的解释。
 
回复:[求助]有什么软件可以提取语料库中所有的搭配形式

以下是引用 emily2006-3-24 10:04:59 的发言:
首先谢谢 oscar3 的答复。
如果是在一个tagged语料库中我想统计所有的动名搭配,那用什么软件来统计呢?如何通过检索tag来统计,希望能得到更加详尽的解释。

这种统计一般都是用语料处理软件的concordance功能块,或者单独的concordance来统计。语料库不同,用来标注动名词的词性码也许不完全一样,在CLAWS7中,动名词的代码和现在分词划为同一类,在词性代码上也没有区别,为<VVG>( -ing participle of lexical verb)。将此代码键入concordance得到的结果应该是动名词和现在分词的总数。
 
Back
顶部