求助,如何统计文本内重要单词个数?

回复: 求助,如何统计文本内重要单词个数?

能不能把你的问题换句话讲讲?我怎么读不明白……
 
回复: 求助,如何统计文本内重要单词个数?

哦,这样的,现在手头有很多封的邮件(文本),我要统计其中每一封邮件内重要的单词的个数(重要的是指除a an the这样的无关紧要的单词就不需统计,只统计属于规定的词库的单词在每封邮件内的个数!)
这样能清楚吗?
 
回复: 求助,如何统计文本内重要单词个数?

这么说你有两个词表,一个是你的“重要的单词”列表,一个是那些“无关紧要的词”组成的stoplist,你只想统计第一个词表在每篇文章中的频数。这样理解对吗?

如果对,AntConc、WordSmith 和Concordance这三个程序都可以使用。当然,自己写个小程序会更快些。
 
回复: 求助,如何统计文本内重要单词个数?

问题就在于我要用自己的程序,可不是专业的,不会弄!
能否指教下?谢谢
 
回复: 求助,如何统计文本内重要单词个数?

问题就在于我要用自己的程序,可不是专业的,不会弄!
能否指教下?谢谢

这个就没法帮你了,又要自己的程序,而自己又不会弄,怎么搞? 现学写个程序是不现实的,还是考虑使用第三方程序吧,毕竟是用程序服务你的研究,不是为了开发程序。
 
回复: 求助,如何统计文本内重要单词个数?

这个就没法帮你了,又要自己的程序,而自己又不会弄,怎么搞? 现学写个程序是不现实的,还是考虑使用第三方程序吧,毕竟是用程序服务你的研究,不是为了开发程序。


是啊。那位朋友说话有点自相矛盾啊。。。。。。自己已经回答自己了。呵呵:D
 
回复: 求助,如何统计文本内重要单词个数?

这么说你有两个词表,一个是你的“重要的单词”列表,一个是那些“无关紧要的词”组成的stoplist,你只想统计第一个词表在每篇文章中的频数。这样理解对吗?

如果对,AntConc、WordSmith 和Concordance这三个程序都可以使用。当然,自己写个小程序会更快些。

laohong,您好:
我刚刚开始涉足语料库,
想请教一下,
如何使用Antconc提取语块(词块)?
谢谢!

尝试多次,无果而终!
急盼指点!!
谢谢!!!
 
老师 从哪里可以弄到这本书Lexis in Contrast

Lexis in Contrast

Corpus-based approaches



@import "/js/dtk/dojox/image/resources/Lightbox.css"; .dijitDialogUnderlay { background-color:black; height:100%; left:0; opacity:0.5; filter: alpha(opacity=50); -moz-opacity: 0.5; -khtml-opacity: 0.5; position:fixed; top:0; width:100%; z-index:500; }
scl_7.png

Edited by Bengt Altenberg and Sylviane Granger University of Lund / Université Catholique de Louvain
 
回复: 求助,如何统计文本内重要单词个数?

用AntConc做个wordlist也就差不多了,LZ表述问题的能力有待提高。
 
回复: 求助,如何统计文本内重要单词个数?

laohong,您好:
我刚刚开始涉足语料库,
想请教一下,
如何使用Antconc提取语块(词块)?
谢谢!

尝试多次,无果而终!
急盼指点!!
谢谢!!!

打开AntConc 3.2.2, 在工具主页面上方点击Clusters/N-Grams, 然后Search Term 选择N-Grams, 设定Min/Max Cluster Size (1≤N≤100,根据需要自行限定),设定 Min Cluster Frequency, 最后选定文本,点击Start, 就可以了。程序比WordSmith简单,但是速度有点慢。见图解。呵呵,我替Laohong老师回答了!
 

附件

  • cluster.jpg
    cluster.jpg
    68.6 KB · 浏览: 6
回复: 求助,如何统计文本内重要单词个数?

LZ只需要在“规定词库”中列出的重要单词在邮件文本中出现的频次,所以其实不需要用到N元分析的。只要列个词表就好了。
 
Back
顶部