搜寻结果

  1. X

    MMAX Annotation Tool

    回复: MMAX Annotation Tool 谢谢laohong。 merger程序是mmax自带的么,还是第三方软件? 我在试mmax的时候,一次只能导入一个文本,那么,如果要导入两个文本,是否要分别导入,而且要起不同的文件名吗? 再次感谢,并祝节日快乐!
  2. X

    MMAX Annotation Tool

    回复: MMAX Annotation Tool laohong说,mmax可以用来标注对齐的语料库,有问题想问: 有两个文件,一个是英文文件,一个是汉语译文,用max进行对齐标注的时候,是要把这两个文件合并成一个文件,还是分别调入max?如果是分别调入,如何操作?
  3. X

    [CfP] Using Corpora in Contrastive and Translation Studies

    回复: [CfP] Using Corpora in Contrastive and Translation Studies 同意,严重地!
  4. X

    推荐两本 Programming for Linguists 的书 PERL JAVA

    回复: 推荐两本 Programming for Linguists 的书 PERL JAVA 请问,如何一次处理将子目录里的文件进行处理?
  5. X

    我想组织一次团购wordsmith tools 5.0

    回复: 我想组织一次团购wordsmith tools 5.0 你不如先用40
  6. X

    如何将词性赋码后的文本中的单词去掉只保留赋码?

    Re: 回复: 如何将词性赋码后的文本中的单词去掉只保留赋码? paraconc和monoconc可以。
  7. X

    如何将词性赋码后的文本中的单词去掉只保留赋码?

    不知道你要用来做什么用。另外,文本2和文本3有何区别?
  8. X

    [Download] ICTCLAS2008

    Re: 回复: [Download] ICTCLAS2008 把系统时间调整到2008年8月的某一天试试
  9. X

    [Download] ICTCLAS2008

    Re: 请您为此界面提宝贵意见 好好好好啊好哦
  10. X

    ictcals整合版(用户辞典)使用方法

    1、到本版下载(感谢DR YOUNG的辛苦工作和ICTCALS公开源码): http://www.corpus4u.org/showthread.php?p=25114#post25114 然后 2、用户辞典userdict.txt放在和可执行程序ictclas同一个文件夹。 3、系统时间调整为2008年7月份。 4、把data文件夹里以userdict开头的文件(如有)userdict.pdat和userdic.pos删除。 5、如果想优先使用用户辞典, 修改Configure.xml(用记事本等编辑软件打开) <UserDict>Off</UserDict>...
  11. X

    [Download] ICTCLAS2008

    Re: ICTCLAS2008整合版下载 非常感谢1
  12. X

    最好的中文分词系统

    Re: 回复: Re: 回复: 最好的中文分词系统 好人! 请问进行让选择调用用户词典,能否选择是否标注词性、是否只分词不标注等,调试后上传程序呢。谢谢了。
  13. X

    用perl给汉字加空格,失败,求助

    s/([^\x00-\x79][^\x00-\x79][^\x00-\x79])/$1 /g; utf-8,用这个
  14. X

    用perl给汉字加空格,失败,求助

    但是只针对ansi码,utf-8不可以
  15. X

    用perl给汉字加空格,失败,求助

    s/([\x80-\xff][\x80-\xff])/$1 /g; 用这个,成功了
  16. X

    用perl给汉字加空格,失败,求助

    Re: 回复: 用perl给汉字加空格,失败,求助 试了几种编码,包括utf-8,好像都不行
  17. X

    用perl给汉字加空格,失败,求助

    1、用editplus和emeditor,通过正则表达式,将 ([^\x80-\xff]) 替换成 \1 (1后面有个空格) 能够将给汉字后面加上一个空格。 2、反向操作,亦即去除空格,也成功 ([^\x80-\xff]) (右括号“)”后有一个空格) 替换为 \1(1后没有空格) 3、用perl,可以去除空格,不过和editplus有点小小区别,代码如下: open output, ">ttt.txt"; open input, "in.txt"; while (<input>) { s/([\x80-\xff])...
  18. X

    信息处理用现代汉语分词词表

    Re: 回复: 信息处理用现代汉语分词词表 好像还没有出来呢
Back
顶部