用AntConc处理中文concordance, wordlist, N-gram

回复: 用AntConc处理中文concordance, wordlist, N-gram

这次在AACL2008(http://corpus.byu.edu/aacl2008/)会议期间,和AntConc的作者Laurence Anthony(http://www.antlab.sci.waseda.ac.jp/)有了“零距离”的接触。和Laurence讨论了一些AntConc的问题,如中文concordance中间对不齐、一次性打开多个文本出错等问题。Laurence解释了问题的原因,也介绍了解决的办法,这里和大家分享一哈:

1、关于中文concordance中间对不齐,他建议最好去除文本中的所有中文标点符号再试试(我还没试);
2、关于一次性打开多个文本导致程序出错,他认为是Windows的系统问题,如果要打开多个文本,他建议使用File, Open Dir...的功能。本人试了一下,确实不错。

另外,Laurence还透露他正在开发自己的ParaConc,预计界面和功能都要比Barlow的好。而且,他还是准备免费推出 -- 各位拭目以待吧。

最后,贴上一张与Laurence的合照,沾名人一点光啊。
 
Last edited:
回复: 用AntConc处理中文concordance, wordlist, N-gram

1、关于中文concordance中间对不齐,他建议最好去除文本中的所有中文标点符号再试试(我还没试);

他也提到把半角码换成全角码.我用TextPro试了一下,有所改进.

另外,Laurence还透露他正在开发自己的ParaConc,预计界面和功能都要比Barlow的好。而且,他还是准备免费推出 -- 各位拭目以待吧。

还有另一个好消息:他还要添加ConcGram。
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

这次在AACL2008(http://corpus.byu.edu/aacl2008/)会议期间,和AntConc的作者Laurence Anthony(http://www.antlab.sci.waseda.ac.jp/)有了“零距离”的接触。和Laurence讨论了一些AntConc的问题,如中文concordance中间对不齐、一次性打开多个文本出错等问题。Laurence解释了问题的原因,也介绍了解决的办法,这里和大家分享一哈:

1、关于中文concordance中间对不齐,他建议最好去除文本中的所有中文标点符号再试试(我还没试);
2、关于一次性打开多个文本导致程序出错,他认为是Windows的系统问题,如果要打开多个文本,他建议使用File, Open Dir...的功能。本人试了一下,确实不错。

另外,Laurence还透露他正在开发自己的ParaConc,预计界面和功能都要比Barlow的好。而且,他还是准备免费推出 -- 各位拭目以待吧。

最后,贴上一张与Laurence的合照,沾名人一点光啊。


free for us??? can't be better!
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

这次在AACL2008(http://corpus.byu.edu/aacl2008/)会议期间,和AntConc的作者Laurence Anthony(http://www.antlab.sci.waseda.ac.jp/)有了“零距离”的接触。和Laurence讨论了一些AntConc的问题,如中文concordance中间对不齐、一次性打开多个文本出错等问题。Laurence解释了问题的原因,也介绍了解决的办法,这里和大家分享一哈:

1、关于中文concordance中间对不齐,他建议最好去除文本中的所有中文标点符号再试试(我还没试);
2、关于一次性打开多个文本导致程序出错,他认为是Windows的系统问题,如果要打开多个文本,他建议使用File, Open Dir...的功能。本人试了一下,确实不错。

另外,Laurence还透露他正在开发自己的ParaConc,预计界面和功能都要比Barlow的好。而且,他还是准备免费推出 -- 各位拭目以待吧。

最后,贴上一张与Laurence的合照,沾名人一点光啊。
Glad to see the picture of two authorities in corpus.
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

Glad to see the picture of two authorities in corpus.

Authority 我还算不上。不过,当时那个掌镜的才真正是。只是未经同意,没有贸然上传......
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

...最后,贴上一张与Laurence的合照,沾名人一点光啊。

照片去掉了,因为有女网友发悄悄话说有损在她们心目中的光辉形象。
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

你可以ps一下再上传的。
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

菜鸟问题:
按照如下操作,倒入了ictclas分词后的文件,然后点击start但是没有结果出来呀。请高手指点是怎么回事呢





3.2.1w 是最新版本,应该不是版本问题。如果使用的是英文系统,查看你的语言和区域设置搞对了没有;如果设置没问题,或者本来就是中文系统,就检查是否做到了下面几点(都是本thread前面讨论过的,看来你需要读第三遍啊):

1、设置AntConc的Global Settings:
Global Settings, Language Encodings, Edit, choose Unicode Encodings, Unicode (utf8), Apply.

2、对文本进行分词处理或汉字加空格:
要想得到wordlist或character list,就得先把汉语文本分词处理,具体关于分词工具及其使用可在本坛查找。也可以简单地给每两个汉字间加个空格,从而达到检索目的。

3、转存文本成utf-8格式:
用Notepad或其它纯文本编辑软件如EditPlus等打开要检索的文本,然后转存,选择编码Encode为UTF-8。

4、使用AntConc得到Wordlist或Concordances。

Good luck!
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

把你的文本发上来我们帮你诊断一下。
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

That is an external link and you will need to register and login at that site in order to access the attachment.

I'm sorry to say that I can not get this copy of short guide. Will you paste it here?
 
回复: 用AntConc处理中文concordance, wordlist, N-gram

请教:如何用AntConc生成一个-5/+5跨距内各搭配词的词频数据?
比如:
word Total L. R. L5 L4 L3 L2 L1 * R1 R2 R3 R4 R5
 
Re: 回复: 用AntConc处理中文concordance, wordlist, N-gram

请教:如何用AntConc生成一个-5/+5跨距内各搭配词的词频数据?
比如:
word Total L. R. L5 L4 L3 L2 L1 * R1 R2 R3 R4 R5

你可以利用其中的collocates 功能实现,具体请参考user guide
 
回复: Re: 回复: 用AntConc处理中文concordance, wordlist, N-gram

你可以利用其中的collocates 功能实现,具体请参考user guide
谢谢清风出袖!可是我用AntConc试了几次,还是无法得出共现词具体在各距位上的频次信息,我在Collocates选项中得到的结果是下面这种形式的:
Rank Freq. Freq.(L) Freq.(R) T-score Word

Antconc的Readme我也看过几次了,可是还是没有办法得出我想要的各词在各距位上的具体信息。
烦请各位c友告知具体解决方法。千恩万谢!
 
Re: 回复: Re: 回复: 用AntConc处理中文concordance, wordlist, N-gram

谢谢清风出袖!可是我用AntConc试了几次,还是无法得出共现词具体在各距位上的频次信息,我在Collocates选项中得到的结果是下面这种形式的:
Rank Freq. Freq.(L) Freq.(R) T-score Word

Antconc的Readme我也看过几次了,可是还是没有办法得出我想要的各词在各距位上的具体信息。
烦请各位c友告知具体解决方法。千恩万谢!

它仅仅能提供简单的相关搭配词的统计信息,无法提供你所要的那种模式。
 
回复: Re: 回复: Re: 回复: 用AntConc处理中文concordance, wordlist, N-gram

它仅仅能提供简单的相关搭配词的统计信息,无法提供你所要的那种模式。
谢谢清风出袖!我昨天试了一下wordsmith5.0的下载版,里面"pattern"选项可以生成各共现词在各距位上的频次信息,但因为是demo的,所以只能显示2行,其余的都看不到。所以今天狠了狠心,还是打电话去外教社定购CEM了。完全靠自己自学corpus linguistics真的很难,尤其是像我这样天生害怕数学的文科女生。幸好有corpus4u各位c友的无私帮助,使我现今还能在语料库的沙滩上徘徊,不致望而却步。衷心希望自己每天都能向语料库的海洋更近一步!谢谢各位c友!好了,该回去“结网”了:)
 
Re: 回复: Re: 回复: Re: 回复: 用AntConc处理中文concordance, wordlist, N-gram

谢谢清风出袖!我昨天试了一下wordsmith5.0的下载版,里面"pattern"选项可以生成各共现词在各距位上的频次信息,但因为是demo的,所以只能显示2行,其余的都看不到。所以今天狠了狠心,还是打电话去外教社定购CEM了。完全靠自己自学corpus linguistics真的很难,尤其是像我这样天生害怕数学的文科女生。幸好有corpus4u各位c友的无私帮助,使我现今还能在语料库的沙滩上徘徊,不致望而却步。衷心希望自己每天都能向语料库的海洋更近一步!谢谢各位c友!好了,该回去“结网”了:)


呵呵数学没什么可怕的有心这事竟成祝你好运!
 
Back
顶部