I iamwho 2008-11-20 #1 1. 建纯英文的语料库时,文本文件应该保存为什么格式?ASCII,ANSI,Unicode或UTF-8? 2. 如果在Windows系统下面进行POS tagging,是不是需要WinClaws?看Regsoft上面的报价是$200,CLAWS4是多少钱? 谢谢
1. 建纯英文的语料库时,文本文件应该保存为什么格式?ASCII,ANSI,Unicode或UTF-8? 2. 如果在Windows系统下面进行POS tagging,是不是需要WinClaws?看Regsoft上面的报价是$200,CLAWS4是多少钱? 谢谢
A armstrong 高级会员 2008-11-21 #2 回复: 请教两个问题 作者 iamwho: 1. 建纯英文的语料库时,文本文件应该保存为什么格式?ASCII,ANSI,Unicode或UTF-8? 2. 如果在Windows系统下面进行POS tagging,是不是需要WinClaws?看Regsoft上面的报价是$200,CLAWS4是多少钱? 谢谢 Click to expand... 1.格式取决于检索软件,必须和检索软件相匹配。 2.CLAWS4Windows版就是$200.
回复: 请教两个问题 作者 iamwho: 1. 建纯英文的语料库时,文本文件应该保存为什么格式?ASCII,ANSI,Unicode或UTF-8? 2. 如果在Windows系统下面进行POS tagging,是不是需要WinClaws?看Regsoft上面的报价是$200,CLAWS4是多少钱? 谢谢 Click to expand... 1.格式取决于检索软件,必须和检索软件相匹配。 2.CLAWS4Windows版就是$200.
A armstrong 高级会员 2008-11-22 #4 回复: 请教两个问题 作者 iamwho: 谢谢,能不能再说一下常用的检索软件分别采用什么格式,譬如WSmith Click to expand... WSmith采用的是文本文件,Antconc采用文本文件或UTF文件。
回复: 请教两个问题 作者 iamwho: 谢谢,能不能再说一下常用的检索软件分别采用什么格式,譬如WSmith Click to expand... WSmith采用的是文本文件,Antconc采用文本文件或UTF文件。
xujiajin 管理员 Staff member 2008-11-22 #5 回复: 请教两个问题 utf is not a name for text format, but a name for character encoding, supposedly standing for Unicode Transformation Format. The most common utf encoding is utf-8 (i.e. 8-bit transformation format).
回复: 请教两个问题 utf is not a name for text format, but a name for character encoding, supposedly standing for Unicode Transformation Format. The most common utf encoding is utf-8 (i.e. 8-bit transformation format).