A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

本文由 动态语法2005-08-17 发表於 "编程与工具开发" 讨论区

  1. 清风出袖

    清风出袖 高级会员

    it is pity that the notetab pro has no eyes for unicode as well. sigh!
     
  2. mag

    mag 初级会员

    下载以后,只有一些阅读文件,怎么没有setup啊?
     
  3. xujiajin

    xujiajin 管理员 Staff Member

    Files for download: (Version as of Sept-07-2005)

    下载执行文件 Sept-07-2005:

    The whole package (without user guide - see above- in one zip file):
    http://www.corpus4u.com/upload/forum/2005091016320836.zip

    If you want to look at everything on one page, go to:
    http://www.humnet.ucla.edu/alc/chinese/ACWT/ACWT.htm
     
  4. azure991

    azure991 初级会员

    Why can't i get ICTCLAS downloaded?

    It seems that username & password are needed for downloading.
     
  5. xujiajin

    xujiajin 管理员 Staff Member

  6. azure991

    azure991 初级会员

    Thank you, but none of the links above are accessible now
     
  7. alice_zl

    alice_zl 初级会员

    many thanks!!
     
  8. guoguolily

    guoguolily 初级会员

    我已经按照大家说的装上了,可是到底要怎么用呢?哪位好心人,帮我仔细解释一下啊,谢谢!万分感谢!!!!
     
  9. 清风出袖

    清风出袖 高级会员

    请仔细阅读前面的截图,那些截图是很有帮助的。
     
  10. guoguolily

    guoguolily 初级会员

    回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

    为什么我在中文索引的时候会有乱码呢?请帮忙?
     
  11. guoguolily

    guoguolily 初级会员

    回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

    这个我按照您的方法试了,可是还是不行?为什么呢啊?怎么办啊?
     
  12. guoguolily

    guoguolily 初级会员

    为什么我在进行当前文件分词加标的时候,和你们说的不一样啊,总是出现--File"C:\Documentsand settings\owner\桌面\efo~5.csp" not found"?为什么会这样呢?我已经找着前面说的把一些文考到Perl的bin和lib文件下了,怎么还是这样呢?大虾们帮帮忙啊!!!!
     
  13. 动态语法

    动态语法 管理员 Staff Member

    回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

    In order for people to help you out, you need to document the procedures you used. Please tell us every step you took, even if it seems a very trivial one.
     
  14. guoguolily

    guoguolily 初级会员

    我就是找着readme上面说的那样做的阿,现装了notetablight,然后装了pearl,然后把各种所需文件拷贝到相应的文件下下面阿,是不是哪里做错了呢?
     
  15. 动态语法

    动态语法 管理员 Staff Member

    回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

    What did you do with your files?
     
  16. jackzch

    jackzch 普通会员

    Thanks. i've got a lot to learn.
     
  17. 清风出袖

    清风出袖 高级会员

    我发现语料库工具箱中的文件合并功能挺好用的。但是昨天在合并.cls文件时,在将合并后的文件命名时,我发现如果不将合并后的总文件命名为.cls的话,那么被合并的文件会有损失,是否在合并其他文件名后缀不是.txt时都要注意将文件的后缀名改为相应的后缀名以免造成合并后的文件内容有所损失呢?谢谢回应!
     
  18. 动态语法

    动态语法 管理员 Staff Member

    回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

    能否说得具体一点?“损失”了什么?理论上说是不可能的。

    语料库工具箱中的文件合并功能有两个:两个文件简单合并和多个文件复杂和并。您说的是哪个?

    总之给出的信息越多,问题就越容易解决。
     
  19. 清风出袖

    清风出袖 高级会员

    对不起,我没有把意思表达清楚。我讲的是多文件复杂合并。如果原先单个文件后缀名均为.cls, 将其合并后如果我还把总文件命名为后缀名为cls, 这时候我发现原来单个文件中所有的文字都会保存在新文件里面;可是如果总文件以txt 为后缀名,这时候好像就会导致原来单个文件上的部分文字丢失?好像总文件的后缀名必须与原先的单个文件的后缀名一致,可是我如果要使用到多个后缀名不一致的单个文件合并时应该怎么办呢?不知这次意思表达清楚了没有,谢谢动态语法前辈百忙之中赐教!
     
  20. 动态语法

    动态语法 管理员 Staff Member

    回复:A Corpus Worker`s Toolkit:语料库工具箱-0908 更新

    我试了试,没有发现你说的情况。合并功能实际上是DOS的一个功能,不大可能改变原文。

    总文件的后缀名是什么跟程序的执行没有任何关系。建议你用三四个短文做实验,看看有没有问题。

    如果你的文件涉及多个后缀,合并时选“All Files" for “Select File_Types”。

    如果你不打算合并路径下的所有文件,选 "No" for "Merge All Files?",接下来你就有机会挑选(打勾)
    真正要合并的文件。

    另外,如果你已用同样的文件试验多次,注意清除旧文件,以保证自己有一个明确的记录。