请教各位前辈:如何把CLEC中的一个大文本(如ST4)分解成一篇作文一个文本的形式?

现在的CLEC 中的ST2/ST3/ST4/ST5/ST6等都是一个级别的作文放在一个文本文档里,造成几千篇作文放在一个文档里很杂乱,不适合做相关的子语料库。请问有那种软件能否将CLEC 中的大文本进行分类,分成一篇作文一个文档的形式吗?如果不行的话,您知道有那个软件可行,推荐一下好吗?
 
Back
顶部