[求助]如何把一个文本分成若干文本

stream

普通会员
大家好! 我想把一个大的文本按照篇数不同分割为不同的文本形式,请问怎样实现?
还有一个问题:在WSM的dispersion plot中,频数已经过标准化处理了,但是我在四川外语学院学报上看到严辰松 “中国英语学习者错误探源”一文中提到WSM不能进行标准化处理,所以我拿不定主意了。请各位赐教!
 
谢谢!但是laohong给的那个分割器是按照字数来分的,而我想按照文章篇数来分割的。好想用不上啊。
ocean说的用WST4里面的File Utility,我用了File Utility中的splitter,按照上面提示导入源文件和目的文件路径,然后按split now,结果没有任何反应,各位帮忙看看是怎么回事?
 
回复:[求助]如何把一个文本分成若干文本

以下是引用 stream2006-4-6 17:52:34 的发言:
谢谢!但是laohong给的那个分割器是按照字数来分的,而我想按照文章篇数来分割的。好想用不上啊。
ocean说的用WST4里面的File Utility,我用了File Utility中的splitter,按照上面提示导入源文件和目的文件路径,然后按split now,结果没有任何反应,各位帮忙看看是怎么回事?

Yes, Mike Scott's Wordsplitter is much better. Did you read its help file before using it? Here it is:
http://www.corpus4u.org/upload/forum/2006040809385061.rtf
 
many thanks to all of you! i read the its help and use it accoriding the direction, but the system say "can't open" input file. what' s the problem? thanks!
 
回复:[求助]如何把一个文本分成若干文本

i use Mike Scott's Wordsplitter offered by Lahong,Dr.xu
 
我试了一下,可以用的,没问题的。比如我有这个文本http://www.corpus4u.org/upload/forum/2006040921551513.txt

按默认的每200个单词切成一个文件,就会得到4个文本

2006040921560415.jpg


你也试试看?
 
回复:[求助]如何把一个文本分成若干文本

以下是引用 xujiajin2006-4-7 16:46:02 的发言:
http://www.lexically.net/downloads/_freebies/wordsplt.zip
这个小工具就是WST4里File Utility里的splitter。Mike Scott做了一个standalone的版本,这样的话就是您没有WordSmith 4也可以切割文本了。

用standalone版进行 every N words的操作是可以的,但要根据“End of Text Separator”进行操作用问题,无法分割成预期的小文本。
WST3中的splitter已对standalone版本进行了改进。操作的关键是给大文本确定或添加splitting marker (可以word的“查找/替换”完成)。现已对stream提供的大文本进行处理。成功!
 
Standalone的版本也可以split after string 啊。只要设定好 end of text separator就可以了。
 
回复:[求助]如何把一个文本分成若干文本

以下是引用 xujiajin2006-4-12 20:27:30 的发言:
Standalone的版本也可以split after string 啊。只要设定好 end of text separator就可以了。
设定好可以分割,但得到的不是预期的小文本。假定某大文本由txt1-50 的50篇小文本组成,由standalone版作'end of text separator"分割,结果得到是“去头”的次级文本,即sp1.txt 由 2-50;sp2.txt, 3-50;由此类推,只有 sp50.txt为 独立的第50篇构成。你不妨 试试,或许我因设置错误而得到这错误的结论。
 
Back
顶部