为何用AntConc两次检测的结果不一样啊,好像是每次都不一样,新手上路,请各位大侠指点,谢谢
老师,您好,
我用了AntConc,发现有点问题,我用CONCORDANCE,索引"我们",有2007 HITS,但是,我回到COLLOCATE模块后,输入"我"或"们,却只有3个搭配了,按道理,"我"和"们"的搭配也应该有2007个才对呀!也就是说,AntConc不能以汉字找搭配,或者是我的设置有问题?(我完全按本论坛里所说的标准设置的)
请问SMITHWORD有找字搭配的功能吗?难道一定要用它?
麻烦您抽空回答一下.
学生 洪涛敬上
大家好
关于这款软件,我有些地方不是很明白
请大家指点
如何使用这款软件对已经进行了分词的语料进行格式的查询
比如“V+N”这种动词名词组合串?
谁能帮我在antconc上试一下这个文本?是藏文的,已经分词了,拜托各位了,我怎么试也显示不出藏文,用的字库是微软vista的himalaya,是unicode编码,字库和文本在附件里,谢谢!
不懂藏文,不过AntConc还是可以处理的。这里是我的做法:
1、安装himalaya.ttf字体(直接复制粘贴到C:\Windows\Fonts文件夹后系统会自动安装);
2、重新把文本转存成UTF-8的;
3、打开AntConc,设置Global Settings,把Font Settings的三项全部选成Microsoft Himalaya; 把Language Encodings设置成Standard Encodings里的Unicode(utf-8),然后Apply保存设置;
4、导入文本进行分析。这里是截图供参考:
小和两句。
蚍蜉可堪词匠职,集腋终得成大势。
注:蚍蜉,即蚂蚁,借指Ant(AntConc的中心词)。词匠即是WordSmith。这一句是用来感谢Laurence Anthony的无私之举的。
同时也希望大家通过Corpus4u这个空间,“茹切如搓,如琢如磨”,集腋成裘,聚沙成塔,推动语料库研究在中国的发展。
AntConc操作更简单,步骤少一些,因为不用建index。但对大语料吃力一点。
http://www.antlab.sci.waseda.ac.jp/software/AntConc_Help/AntConc_Help.htm
N-Grams/Clusters
把Clusters选项卡下的N-Grams勾上就可以了。
AntConc 对藏文处理是不完善的,他只是可以支持非常多的编码(包括UNICODE编码),本身对藏文一无所知。我刚学了几句藏文,发现如果检索简单藏文字母,AntConc对于有下加字和元音的藏文“字”有错误(说明是字节匹配,不是字匹配)。目前能完美处理藏文检索的只有俺开发的检索系统。可惜,由于某种原因,目前尚不能公开给大家使用,等一段时间吧。不懂藏文,不过AntConc还是可以处理的。
这次在AACL2008(http://corpus.byu.edu/aacl2008/)会议期间,和AntConc的作者Laurence Anthony(http://www.antlab.sci.waseda.ac.jp/)有了“零距离”的接触。和Laurence讨论了一些AntConc的问题,如中文concordance中间对不齐、一次性打开多个文本出错等问题。Laurence解释了问题的原因,也介绍了解决的办法,这里和大家分享一哈:
1、关于中文concordance中间对不齐,他建议最好去除文本中的所有中文标点符号再试试(我还没试);
2、关于一次性打开多个文本导致程序出错,他认为是Windows的系统问题,如果要打开多个文本,他建议使用File, Open Dir...的功能。本人试了一下,确实不错。
另外,Laurence还透露他正在开发自己的ParaConc,预计界面和功能都要比Barlow的好。而且,他还是准备免费推出 -- 各位拭目以待吧。
最后,贴上一张与Laurence的合照,沾名人一点光啊。
AntConc 对藏文处理是不完善的,他只是可以支持非常多的编码(包括UNICODE编码),本身对藏文一无所知。我刚学了几句藏文,发现如果检索简单藏文字母,AntConc对于有下加字和元音的藏文“字”有错误(说明是字节匹配,不是字匹配)。目前能完美处理藏文检索的只有俺开发的检索系统。可惜,由于某种原因,目前尚不能公开给大家使用,等一段时间吧。
But I am not allowed to download.You can get a copy of AntCon short guide in PDF format at http://www.fleric.org.cn/forum/viewthread.php?tid=216