SWECCL中的SUBCORPUS generator 生成SWECCL1.0中的子语料库要作如何调整?

SWECCL中的SUBCORPUS generator 不能生成SWECCL2.0以外的子预料库吗?如果需要生成SWECCL1.0中的子语料库要作如何调整。
 
回复: SWECCL中的SUBCORPUS generator 生成SWECCL1.0中的子语料库要作如何调整?

SUBCORPUS generator 是给SWECCL2.0书面语语料写的。

因为每个语料库的header不一,因此,不好统一。

SWECCL1.0可根据需要编写个batch文件即可。
 
回复: SWECCL中的SUBCORPUS generator 生成SWECCL1.0中的子语料库要作如何调整?

SUBCORPUS generator 是给SWECCL2.0书面语语料写的。

因为每个语料库的header不一,因此,不好统一。

SWECCL1.0可根据需要编写个batch文件即可。

许博士,你努把力吧这个BATCH 变出来大家想用下,好吗?
 
回复: SWECCL中的SUBCORPUS generator 生成SWECCL1.0中的子语料库要作如何调整?

因为有点费事,而且因目的不同,写出来的还不一样。

我给你个提示:你自己琢磨或请周围人帮忙吧。

我的做法是:
1、search(用自己熟悉的工具都可以)header,找到含你要的属性值(比如年级或作文题等)的文件名,
2、在记事本里用dos命令里的copy,copy 所有的文件名至所要存放的目录写好表达式,将文件存为.bat。这里可用Excel过读一下。
 
Back
顶部