分析大量的日语文本请问用什么软件好

本文由 xdx000xdx2011-06-08 发表於 "语料库与语言研究" 讨论区

  1. 求问有什么软件可以用来分析大量的日语文学文本。
     
  2. armstrong

    armstrong 高级会员

    回复: 分析大量的日语文本请问用什么软件好

    用Antconc或者wordsmith tools 4.0以上的版本.
     
  3. 回复: 分析大量的日语文本请问用什么软件好

    谢谢您的解答。只是这两个软件好像都不能直接处理日文。我在论坛里查了一下,好像大家在用这两个软件处理中文时,都先要进行一个分词作业。我还想问一下具体应该怎么执行分词作业,处理日文是否也可以借鉴相同的做法。
     
  4. armstrong

    armstrong 高级会员

    回复: 分析大量的日语文本请问用什么软件好

    处理汉语和日语及韩语一般需要分词或分字后进行.
    但用Antconc检索时可以不分词或分字,可以利用"正则表达式"检索,但要求文件的编码是Utf-8.
    而如果使用wst则最好文件的编码是Unicode,且还要分词或字,因为该软件不支持正则表达式.
     
  5. MTMineR
     
  6. 如armstrong所说,AntConc经过一点设置可以直接检索未分词的汉语和日语文本。MLCT (Multilingual Corpus Tool)也可以。
    仅检索其实不难,其他就要看想怎么分析了