用AntConc处理中文concordance, wordlist, N-gram

Revision History
3.1.303
This is a very minor upgrade with just a few changes:

Changes: Added a few web links about Unicode to the readme file.
Bug fix (Win/Linux): Corrected problem that caused the No. of Hits to not be indicated correctly in the Concordance Plot Tool display when more than one corpus file was being used.
Bug fix: (Linux): Corrected problem that prevented font selections being applied.
 
谢谢Dr. Xu的回复!看了各位前辈的讨论,晚学感觉受益非浅。FreeICTCLAS的分词结果可以直接输出,很方便实用!我昨天下载的 http://www.hylanda.com
上的海量分词工具分词后结果无法导出呢,感谢corpus4u为我们提供了向各位大侠请教和学习的机会啊
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

几乎用了一个上午看这个帖子,边看边对照着做,测试成功。
谢谢各位做出的贡献。
遗憾的是,检索词显示位置不齐,这问题可有办法解决?
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

没有,原程序设计还没改这点。
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

January 23rd, 2007.
New help system released for AntConc 3.2.0
A new version of the help system for concordance software, AntConc, can now be viewed from the Software page. Enjoy!
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

AntConhas been up-to-dated again on Mar.11. Go and get the latest version of it.
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

大家好,我是一名新会员,急需大家的帮助。 我在做论文,需要一个能统计中英文词频的软件,如果谁知道再哪下载, 麻烦转告我一声,万分感谢。
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

本站有很多相关的讨论,比如这里提到的 AntConc 就能统计词频。多看看论坛的帖子,看看知识库里面的东西。多用一下 Google
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

我刚刚下载了3.2.1w版本,可是发现不能搜索中文啊,请问应该怎么设置?谢谢
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

3.2.1w 是最新版本,应该不是版本问题。如果使用的是英文系统,查看你的语言和区域设置搞对了没有;如果设置没问题,或者本来就是中文系统,就检查是否做到了下面几点(都是本thread前面讨论过的,看来你需要读第三遍啊):

1、设置AntConc的Global Settings:
Global Settings, Language Encodings, Edit, choose Unicode Encodings, Unicode (utf8), Apply.

2、对文本进行分词处理或汉字加空格:
要想得到wordlist或character list,就得先把汉语文本分词处理,具体关于分词工具及其使用可在本坛查找。也可以简单地给每两个汉字间加个空格,从而达到检索目的。

3、转存文本成utf-8格式:
用Notepad或其它纯文本编辑软件如EditPlus等打开要检索的文本,然后转存,选择编码Encode为UTF-8。

4、使用AntConc得到Wordlist或Concordances。

Good luck!
 
Back
顶部