X xdx000xdx 2011-06-09 #3 回复: 分析大量的日语文本请问用什么软件好 谢谢您的解答。只是这两个软件好像都不能直接处理日文。我在论坛里查了一下,好像大家在用这两个软件处理中文时,都先要进行一个分词作业。我还想问一下具体应该怎么执行分词作业,处理日文是否也可以借鉴相同的做法。
回复: 分析大量的日语文本请问用什么软件好 谢谢您的解答。只是这两个软件好像都不能直接处理日文。我在论坛里查了一下,好像大家在用这两个软件处理中文时,都先要进行一个分词作业。我还想问一下具体应该怎么执行分词作业,处理日文是否也可以借鉴相同的做法。
A armstrong 高级会员 2011-06-09 #4 回复: 分析大量的日语文本请问用什么软件好 处理汉语和日语及韩语一般需要分词或分字后进行. 但用Antconc检索时可以不分词或分字,可以利用"正则表达式"检索,但要求文件的编码是Utf-8. 而如果使用wst则最好文件的编码是Unicode,且还要分词或字,因为该软件不支持正则表达式.
回复: 分析大量的日语文本请问用什么软件好 处理汉语和日语及韩语一般需要分词或分字后进行. 但用Antconc检索时可以不分词或分字,可以利用"正则表达式"检索,但要求文件的编码是Utf-8. 而如果使用wst则最好文件的编码是Unicode,且还要分词或字,因为该软件不支持正则表达式.
ArthurW 2016-12-09 #6 如armstrong所说,AntConc经过一点设置可以直接检索未分词的汉语和日语文本。MLCT (Multilingual Corpus Tool)也可以。 仅检索其实不难,其他就要看想怎么分析了