laohong 管理员 Staff member 2008-08-04 #2 Wordsmith, AntConc, Word Pattern, Concordance, and many many more...
williamJia 开放语料库项目 2009-07-13 #3 回复: 谁有免费的英语词频统计软件? http://www.corpus4u.org/showthread.php?t=4826 第四楼的软件可以产生统计词表,包括word和lemma两种不同形式 http://www.corpus4u.org/attachment.php?attachmentid=599&d=1245724858
回复: 谁有免费的英语词频统计软件? http://www.corpus4u.org/showthread.php?t=4826 第四楼的软件可以产生统计词表,包括word和lemma两种不同形式 http://www.corpus4u.org/attachment.php?attachmentid=599&d=1245724858
M mandel 2009-07-20 #4 回复: 谁有免费的英语词频统计软件? 我写过一个,不妨用用,不过是在dos下执行。下载地址:http://59.77.17.146/download/software/newfreq.exe。使用例子:newfreq -1 -f -v -i bnc.txt -s bnc.unigram.txt 把bnc.txt的词频保存在bnc.unigram.txt。对于500M的BNC文本语料,大约需要1分半钟。
回复: 谁有免费的英语词频统计软件? 我写过一个,不妨用用,不过是在dos下执行。下载地址:http://59.77.17.146/download/software/newfreq.exe。使用例子:newfreq -1 -f -v -i bnc.txt -s bnc.unigram.txt 把bnc.txt的词频保存在bnc.unigram.txt。对于500M的BNC文本语料,大约需要1分半钟。
laohong 管理员 Staff member 2009-07-20 #5 回复: 谁有免费的英语词频统计软件? 作者 mandel: 我写过一个,不妨用用,不过是在dos下执行。下载地址:http://59.77.17.146/download/software/newfreq.exe。使用例子:newfreq -1 -f -v -i bnc.txt -s bnc.unigram.txt 把bnc.txt的词频保存在bnc.unigram.txt。对于500M的BNC文本语料,大约需要1分半钟。 Click to expand... 确实强大,处理256MB的语料,结果如下: 35957489 words, 1 gram count=35957489, unique=304748 sorting... 58644ms 史兄确定新加坡的行程了吗?Thai-Girl啤酒已经准备好了就等你……
回复: 谁有免费的英语词频统计软件? 作者 mandel: 我写过一个,不妨用用,不过是在dos下执行。下载地址:http://59.77.17.146/download/software/newfreq.exe。使用例子:newfreq -1 -f -v -i bnc.txt -s bnc.unigram.txt 把bnc.txt的词频保存在bnc.unigram.txt。对于500M的BNC文本语料,大约需要1分半钟。 Click to expand... 确实强大,处理256MB的语料,结果如下: 35957489 words, 1 gram count=35957489, unique=304748 sorting... 58644ms 史兄确定新加坡的行程了吗?Thai-Girl啤酒已经准备好了就等你……