xizero00的最近内容

  1. X

    tagger、SentenceTokenizer方面的几段Python代码

    回复: tagger、SentenceTokenizer方面的几段Python代码 我也放一个基于该版本的修改版,更亲民一点,呵呵 (1)使用方法 解压后的目录介绍: srcendir为要处理的英文目录 dstendir为处理后的英文目录 srccndir为要处理的中文目录 dstcndir为处理后的中文目录 首先将要处理的文件放到对应的目录里面 用户只需要运行 HunposWithTokenizer.exe 或者 TreeTaggerTokenizer.exe 即可完成对英文的标注与赋码。 注意:暂时不支持中文。。。。(你也可以测试下中文) (2)源代码 附上源代码...
  2. X

    哪位能推荐检索软件开发公司/个人

    回复: 哪位能推荐检索软件开发公司/个人 我们能够提供双语检索软件开发,目前已经开发的正在使用的可以参看 pcpt.cslg.cn 如您有需求可以和我联系 QQ:一 一 六 四 五 七 一 二 七
  3. X

    自建一个小型的汉语语料库

    回复: 自建一个小型的汉语语料库 你首先需要对这些语料进行标注-》赋码然后就可以做成语料库了 如果想读取pdf,你可能需要了解tika,来读取pdf里面的文字。
  4. X

    2003上海语料库语言学国际会议文集

    回复: 2003上海语料库语言学国际会议文集 标题错了,应该是2013吧。
  5. X

    欢迎访问汉英政治平行语料库

    回复: 欢迎访问汉英政治平行语料库 我会啊
Back
顶部