http://www.cncorpus.org/resources/MyTxtSegTagTool.rar
据说在业内这个SegTag是跟ICTCLAS相当的工具。
这个软件需要安装DotNet framework运行环境。
据说在业内这个SegTag是跟ICTCLAS相当的工具。
这个软件需要安装DotNet framework运行环境。
不要对于古汉语词性自动标注报太大希望。
这不是软件作者的事,这根本是个语言学问题,汉语的词类还没有探讨清楚,古汉语的词类更不用说了。
目前我们谈论汉语词类都是削足适履的做法,拿印欧语的鞋,套汉语的脚。
也许许博士说的对,很长一段时间内,古汉语的标注只能手工进行。最近听沈家煊老师的几场讲座,也一直在讲要摆脱印欧语眼光。是的,词类在语言学界一直都没有讨论清楚;所以,其实非常感激标注软件的作者们,他们很不容易。
但是该怎么办呢?语料 库在古汉语研究中该如何应用呢?真的好难
第一,不分词,汉语语料一样可以用。
第二,你可以采取分字(字间加空格)的方法。