请教自建预料库“生语料”的文本格式

自己想建一个个小小的教材语料库供教学使用。但不知道收集的文本文件除了文本以外,还应该包括什么其他索引性质的东西,如;教材名称,出版社,版本,第几单元,第几课,等等。主要是考虑节省时间,省得以后返工再去添加必要的信息。
如果各位能提供一个信息比较全面的样本,本人万分感谢。
 
回复: 请教自建预料库“生语料”的文本格式

这个没有一定之规 一切视需要而定
 
Back
顶部