请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

FLOB中与HAPPEN的MI大于3的我几乎看不到content words 啊,我没有全文语料库,只有Dr.Xiao提供的INDEXER TOKEN, 这是真的吗?
 
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

FLOB is a copyrighted corpus, i.e. it is not freely available. So Dr. Xiao can't provide the whole corpus.
 
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

是这样的,Dr. Xiao 的确没有提供FLOB corpus 给我。我从在线FLOB搜索到HAPPEN的检索行319例,Dr. Xiao的临时链接中wsmith版FLOB. index 中HAPPEN也显示319例,我利用这个index文件在wsmith4中计算了MI;作为新手,我觉得wsmith工具的使用中,计算MI值利用index.token文件就可以吧,但结果是几乎很少有MI大于3的content words出现,因此有点疑惑。
 
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

MI 大于3怎么了?
 
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

You can compute MI scores using the indexed wordlist. Collocations can of course include function words. And among the few contents words is "acciddent". Without the full corpus at hand, if you want to know what is "happening", you can use the online FLOB concordancer - after excluding the instances of "happen* to" which means "by chance" - you will find what is happening typically refers to accidents, something aweful,somethin nasty, and "the inevitable" (If something is desired, why should one try to avoid it?).

是这样的,Dr. Xiao 的确没有提供FLOB corpus 给我。我从在线FLOB搜索到HAPPEN的检索行319例,Dr. Xiao的临时链接中wsmith版FLOB. index 中HAPPEN也显示319例,我利用这个index文件在wsmith4中计算了MI;作为新手,我觉得wsmith工具的使用中,计算MI值利用index.token文件就可以吧,但结果是几乎很少有MI大于3的content words出现,因此有点疑惑。
 
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

to xu,
MI大于3表示两词是显著搭配词, 现学现卖了
to xiao,
我首先在wordlist中打开FLOB index, do lemma matches, and then compute relationships, 但显示的依然是happen, happened, happening, happens, 各自的MI,不是HAPPEN的,里面没有accident, 甚至没有content words,直觉上感觉不对,但不知哪里出了问题。
CLEC中HAPPEN出现400余次,FLOB中只有300余次。
在on FLOB concordance搜到的检索行没有太多context, 但我已经很满意了,呵呵。
 
Last edited:
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

我发现我刚发的帖子被他人修改了,我可以接受他人拥有这种权限,但请尊重别人发言的权利。:D
 
回复: 请问wsmith4计算MI值只需要INDEXER TOKEN 即可吗

求教MI值和期望频数的算法.谢谢!
 
Back
顶部