A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

Files for download: (Version as of Sept-07-2005)

下载执行文件 Sept-07-2005:

The whole package (without user guide - see above- in one zip file):
http://www.corpus4u.com/upload/forum/2005091016320836.zip

If you want to look at everything on one page, go to:
http://www.humnet.ucla.edu/alc/chinese/ACWT/ACWT.htm
 
我已经按照大家说的装上了,可是到底要怎么用呢?哪位好心人,帮我仔细解释一下啊,谢谢!万分感谢!!!!
 
回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

为什么我在中文索引的时候会有乱码呢?请帮忙?
 
回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

这个我按照您的方法试了,可是还是不行?为什么呢啊?怎么办啊?
 
为什么我在进行当前文件分词加标的时候,和你们说的不一样啊,总是出现--File"C:\Documentsand settings\owner\桌面\efo~5.csp" not found"?为什么会这样呢?我已经找着前面说的把一些文考到Perl的bin和lib文件下了,怎么还是这样呢?大虾们帮帮忙啊!!!!
 
回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

以下是引用 guoguolily2006-3-10 20:58:48 的发言:
为什么我在进行当前文件分词加标的时候,和你们说的不一样啊,总是出现--File"C:\Documentsand settings\owner\桌面\efo~5.csp" not found"?为什么会这样呢?我已经找着前面说的把一些文考到Perl的bin和lib文件下了,怎么还是这样呢?大虾们帮帮忙啊!!!!

In order for people to help you out, you need to document the procedures you used. Please tell us every step you took, even if it seems a very trivial one.
 
我就是找着readme上面说的那样做的阿,现装了notetablight,然后装了pearl,然后把各种所需文件拷贝到相应的文件下下面阿,是不是哪里做错了呢?
 
我发现语料库工具箱中的文件合并功能挺好用的。但是昨天在合并.cls文件时,在将合并后的文件命名时,我发现如果不将合并后的总文件命名为.cls的话,那么被合并的文件会有损失,是否在合并其他文件名后缀不是.txt时都要注意将文件的后缀名改为相应的后缀名以免造成合并后的文件内容有所损失呢?谢谢回应!
 
回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

以下是引用 清风出袖2006-3-27 11:19:25 的发言:
我发现语料库工具箱中的文件合并功能挺好用的。但是昨天在合并.cls文件时,在将合并后的文件命名时,我发现如果不将合并后的总文件命名为.cls的话,那么被合并的文件会有损失,是否在合并其他文件名后缀不是.txt时都要注意将文件的后缀名改为相应的后缀名以免造成合并后的文件内容有所损失呢?谢谢回应!

能否说得具体一点?“损失”了什么?理论上说是不可能的。

语料库工具箱中的文件合并功能有两个:两个文件简单合并和多个文件复杂和并。您说的是哪个?

总之给出的信息越多,问题就越容易解决。
 
对不起,我没有把意思表达清楚。我讲的是多文件复杂合并。如果原先单个文件后缀名均为.cls, 将其合并后如果我还把总文件命名为后缀名为cls, 这时候我发现原来单个文件中所有的文字都会保存在新文件里面;可是如果总文件以txt 为后缀名,这时候好像就会导致原来单个文件上的部分文字丢失?好像总文件的后缀名必须与原先的单个文件的后缀名一致,可是我如果要使用到多个后缀名不一致的单个文件合并时应该怎么办呢?不知这次意思表达清楚了没有,谢谢动态语法前辈百忙之中赐教!
 
回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

以下是引用 清风出袖2006-3-28 9:19:55 的发言:
对不起,我没有把意思表达清楚。我讲的是多文件复杂合并。如果原先单个文件后缀名均为.cls, 将其合并后如果我还把总文件命名为后缀名为cls, 这时候我发现原来单个文件中所有的文字都会保存在新文件里面;可是如果总文件以txt 为后缀名,这时候好像就会导致原来单个文件上的部分文字丢失?

我试了试,没有发现你说的情况。合并功能实际上是DOS的一个功能,不大可能改变原文。

以下是引用 清风出袖2006-3-28 9:19:55 的发言:
好像总文件的后缀名必须与原先的单个文件的后缀名一致,可是我如果要使用到多个后缀名不一致的单个文件合并时应该怎么办呢?

总文件的后缀名是什么跟程序的执行没有任何关系。建议你用三四个短文做实验,看看有没有问题。

如果你的文件涉及多个后缀,合并时选“All Files" for “Select File_Types”。

如果你不打算合并路径下的所有文件,选 "No" for "Merge All Files?",接下来你就有机会挑选(打勾)
真正要合并的文件。

另外,如果你已用同样的文件试验多次,注意清除旧文件,以保证自己有一个明确的记录。
 
Back
顶部