查找一份paper里有多少个单词,即重复的单词也算一个词,用wordsmith可以吗,还有别的更好的软件吗

回复: 查找一份paper里有多少个单词,即重复的单词也算一个词,用wordsmith可以吗,还有别的更好的软件吗

这叫tokenization,即将文本集中的所有token全部统计出来,用WST和Antcon都可以。如果你只是想初略地统计一篇文章中的单词数(word count),并不特别关心can't, $23.65, so-called等形式,你完全可以用word“工具“中的“字数统计”。
 
回复: 查找一份paper里有多少个单词,即重复的单词也算一个词,用wordsmith可以吗,还有别的更好的软件吗

谢谢回复,用word统计出来的字数只是一个总的字数,但是,我想查的是比如说The出现了100次,但是只算是一个词汇,整张试卷的词汇量为多少。用您所说的两个软件可以做到吗?
 
回复: 查找一份paper里有多少个单词,即重复的单词也算一个词,用wordsmith可以吗,还有别的更好的软件吗

你讲的应该是说如何查找一篇文章中 type 的数目。用 WordSmith Tool 做一个 Word List,在 N 这一栏中的数目就应该是你要的吧。同样AntConc也可以做到,而且是免费软件(感谢Anthony教授)。
 
回复: 查找一份paper里有多少个单词,即重复的单词也算一个词,用wordsmith可以吗,还有别的更好的软件吗

thank yor for your reply.我最开始用wordsmith的想法也是想统计 N 这一栏中的数量就应该是我想要的,可是我在网上下的免费版的 wordsmith,N显示的数据为489,可是从第20几个之后就不显示是什么词了,只说太长了,没法显示。我很疑惑,这不是统计单词量吗,wordsmith难道统计的还是collocation?
 
回复: 查找一份paper里有多少个单词,即重复的单词也算一个词,用wordsmith可以吗,还有别的更好的软件吗

谢谢回复,用word统计出来的字数只是一个总的字数,但是,我想查的是比如说The出现了100次,但是只算是一个词汇,整张试卷的词汇量为多少。用您所说的两个软件可以做到吗?

我用的最简单的办法是把文本保存成txt的文本,在Ultraedit里面用^P 替换空格后,排序,去重,就可以得到一个word list了。但是不算精确。
 
Back
顶部