[求助]什么工具可以用来做中文的keywords?

hancunxin

Moderator
除了wordsmith4可以做中文Keywords(据说可以,有人做过吗?)以外,还有什么其他工具吗?苦于没有wordsmith4,所以想找个替代品。
 
xiaoz说Xaira 也可以。
但是有几个问题要问xiaoz。因为那个帖子是只读的,只好在这里问:
1。log likelihood是怎样算出来的?如何解读?有没有显著性检验?
2。该值是负值是含义是什么?
例如:

" 6 0.0000 17943 0.0191 - 9916.20
的 6824 0.0225 51141 0.0543 - 5800.86
 
回复:[求助]什么工具可以用来做中文的keywords?

Suppose one word occurs 29 times in a 2000-word corpus (Corpus 1) and 34 times in a 2500-word corpus (Corpus 2). Here is the Log-likelihood calculator result:

Item O1 %1 O2 %2 LL
Word 29 1.45 34 1.36 + 0.06

Key:

O1 is observed frequency in Corpus 1
O2 is observed frequency in Corpus 2
%1 and %2 values show relative frequencies in the texts.
+ indicates overuse in O1 relative to O2
- indicates underuse in O1 relative to O2



[本贴已被 作者 于 2006年01月29日 10时06分07秒 编辑过]
 
回复:[求助]什么工具可以用来做中文的keywords?

非常感谢laohong, 能否告诉计算公式,以及LL值达到多大才能确定其为kw
 
Here you can find what you wanted:

Log-likelihood calculator (also see those papers)

http://ucrel.lancs.ac.uk/llwizard.html
 
xaira可以处理用xml格式标注的语料,但是不知道能否处理用其他格式标注的语料?

[本贴已被 作者 于 2006年01月30日 21时58分20秒 编辑过]
 
xaira可以处理用xml格式标注的语料,但是不知道能否处理用其他格式标注的语料,比如北大格式?
 
AntConc 3.1.2 for Windows and Linux recommended by 清风出袖 is full functional for Chinese encodings.

http://www.corpus4u.com/forum_view.asp?forum_id=7&view_id=1471
 
回复:[求助]什么工具可以用来做中文的keywords?

以下是引用 xudekuan2006-2-8 9:50:36 的发言:
would u kind introduce the functions applicable for processing Chinese by the software?
go and download one, and then you will know how functional it is for Chinese.
 
Back
顶部