问一下BFSU collocator colligator

问一个问题
用BFSU collocator ,colligator 检索中国学习者语料跟用ANTCONC 得出的检索行行数天壤之别。
不知道怎么回事
具体是操作都输入provide|provides|provided|providing ,BFSU 得到25
ANTCONC 255
真的不明白了???
 
回复: 问一下BFSU collocator colligator

我的检索结果是一样的,测试语料是CD08_RAW.rar
 

附件

  • AntConc.jpg
    AntConc.jpg
    99.4 KB · 浏览: 14
  • Colligator.jpg
    Colligator.jpg
    104.2 KB · 浏览: 18
  • CD08_RAW.rar
    374.7 KB · 浏览: 17
回复: 问一下BFSU collocator colligator

我们两个人做了测试,AntConc和Colligator的检索结果一样。
为便于说明,可做一个最简单测试。我创建一个文件,里面仅包含provide,provides,provided,providing四个单词。用楼主的regex,应该通过AntConc和Colligator分别搜到4个hits就对了。
测试结果是两个软件结果一致。

发完贴,看到William也回复,大家可以一起看看。
 

附件

  • test.txt
    38 bytes · 浏览: 14
回复: 问一下BFSU collocator colligator

我们两个人做了测试,AntConc和Colligator的检索结果一样。
为便于说明,可做一个最简单测试。我创建一个文件,里面仅包含provide,provides,provided,providing四个单词。用楼主的regex,应该通过AntConc和Colligator分别搜到4个hits就对了。
测试结果是两个软件结果一致。

发完贴,看到William也回复,大家可以一起看看。

我仔细再做一次
还是不一样。图见附件 ,特别谢谢两位博士的解答。另外附上语料库,到底问题出在哪
 
Last edited:
回复: 问一下BFSU collocator colligator

我用Collocator检索,F(n) = 92
我想应该是CLEC格式的问题,因为它既不是Raw(它本身包含错误标注),也不是我们所指的Tagged(我们指的是POS Tag,一般形式是WORD_POS或WORD/POS)
 

附件

  • Collocator.jpg
    Collocator.jpg
    82.3 KB · 浏览: 12
回复: 问一下BFSU collocator colligator

我用Collocator检索,F(n) = 92
我想应该是CLEC格式的问题,因为它既不是Raw(它本身包含错误标注),也不是我们所指的Tagged(我们指的是POS Tag,一般形式是WORD_POS或WORD/POS)

我想这个回答有道理,能不能这样说, collocator 只局限于RAW 语料和一般形式的比如WORD_POS或WORD/POS)赋码语料的检索,对吗?
 
回复: 问一下BFSU collocator

[FONT=宋体]为什么用[/FONT]BFSU collocator [FONT=宋体]计算某词MI[FONT=宋体]值大于[/FONT]3[FONT=宋体]的搭配词跟用[/FONT][/FONT]Antconc得到的[FONT=宋体]数目相差如此之大呢?[/FONT]
[FONT=宋体]如:用[/FONT]Collocator[FONT=宋体]计算得到[/FONT]42[FONT=宋体]个[/FONT]MI[FONT=宋体]值大于[/FONT]3[FONT=宋体]的搭配词,而用[/FONT]Antconc[FONT=宋体]计算得到[/FONT]380[FONT=宋体]个[/FONT]MI[FONT=宋体]值大于[/FONT]3[FONT=宋体]的搭配词,用的是同一语料库([/FONT]CLEC raw[FONT=宋体])。谢谢各位指点![/FONT][/QUOTE]
 
回复: 问一下BFSU collocator colligator

CLEC里有大量尖括号和方括号的标记,不知道你使用CLEC时,是否预先做了清理。不妨你上传一段你使用的CLEC的文本片段。
 
Back
顶部