请教两个问题

1. 建纯英文的语料库时,文本文件应该保存为什么格式?ASCII,ANSI,Unicode或UTF-8?

2. 如果在Windows系统下面进行POS tagging,是不是需要WinClaws?看Regsoft上面的报价是$200,CLAWS4是多少钱?

谢谢
 
回复: 请教两个问题

1. 建纯英文的语料库时,文本文件应该保存为什么格式?ASCII,ANSI,Unicode或UTF-8?

2. 如果在Windows系统下面进行POS tagging,是不是需要WinClaws?看Regsoft上面的报价是$200,CLAWS4是多少钱?

谢谢

1.格式取决于检索软件,必须和检索软件相匹配。
2.CLAWS4Windows版就是$200.
 
回复: 请教两个问题

谢谢,能不能再说一下常用的检索软件分别采用什么格式,譬如WSmith
 
回复: 请教两个问题

utf is not a name for text format, but a name for character encoding, supposedly standing for Unicode Transformation Format. The most common utf encoding is utf-8 (i.e. 8-bit transformation format).
 
Back
顶部