分析大量的日语文本请问用什么软件好

#3
回复: 分析大量的日语文本请问用什么软件好

谢谢您的解答。只是这两个软件好像都不能直接处理日文。我在论坛里查了一下,好像大家在用这两个软件处理中文时,都先要进行一个分词作业。我还想问一下具体应该怎么执行分词作业,处理日文是否也可以借鉴相同的做法。
 

armstrong

高级会员
#4
回复: 分析大量的日语文本请问用什么软件好

处理汉语和日语及韩语一般需要分词或分字后进行.
但用Antconc检索时可以不分词或分字,可以利用"正则表达式"检索,但要求文件的编码是Utf-8.
而如果使用wst则最好文件的编码是Unicode,且还要分词或字,因为该软件不支持正则表达式.
 
#6
如armstrong所说,AntConc经过一点设置可以直接检索未分词的汉语和日语文本。MLCT (Multilingual Corpus Tool)也可以。
仅检索其实不难,其他就要看想怎么分析了
 
顶部