chongchong的最近内容

  1. C

    看一看我的语料库

    回复: 看一看我的语料库 很强大,学习了。提个小建议: 选择 Neon英汉双语语料库 (20万句) FBIS新闻汉英双语语料库 (22万句) 搜索 have a dream ,结果中一些以a开头的单词中的a 也变色了,不知道就是这样的设计还是程序有点小问题
  2. C

    评价一下这个双语句子搜索吧

    http://www.juyy.net 我测试了一些网上的在线英汉双语检索系统,大部分句对库搜索只支持精确匹配,但是现在句对库规模都很有限,这样句对库用于辅助英汉学习是不是帮助不够呢? 这个网站上有个例子,库中有“东盟地区论坛步履蹒跚”这个句子,没有“亚太地区论坛步履蹒跚”这个汉语句子, 但是如果用户搜索“亚太地区论坛步履蹒跚”返回 “东盟地区论坛步履蹒跚”是不是也很有意义呢? 除了从网络上用程序自动抓取双语语料对齐句子,还有什么方法可以得到双语对照句对库呢,哪里可以买到,如果买到了可以自己建个网站开放了为用户提供检索吗?版权有限制吗?
  3. C

    看看这个小程序是不是能帮大家做一些句子对齐工作

    回复: 看看这个小程序是不是能帮大家做一些句子对齐工作 帮忙删除好吗,谢谢了。原因私下发给你了。
  4. C

    看看这个小程序是不是能帮大家做一些句子对齐工作

    回复: 看看这个小程序是不是能帮大家做一些句子对齐工作 版主能把我发的这个帖子和附件删除吗?谢谢!
  5. C

    看看这个小程序是不是能帮大家做一些句子对齐工作

    回复: 看看这个小程序是不是能帮大家做一些句子对齐工作 只保留系统识别相似度大于一定阈值的句子。
  6. C

    多语言基础资源研制和共享--863国家级课题成果进入试推广阶段

    回复: 多语言基础资源研制和共享--863国家级课题成果进入试推广阶段 一直有个问题不明白,这种国家出钱支持的项目成果可以商业化牟利吗? 貌似好多都商业化了,真正该收益的是谁呢?
  7. C

    看看这个小程序是不是能帮大家做一些句子对齐工作

    回复: 看看这个小程序是不是能帮大家做一些句子对齐工作 cmd 要保存结果的话直接输出到一个文件就可以了 SimSenEx_Chong.exe >>result.txt
  8. C

    看看这个小程序是不是能帮大家做一些句子对齐工作

    初来乍到,给大家提供一个小工具,设计初衷是提取中英文相似句子的,看到句子对齐的讨论较多,就改了改,看看能不能帮大家做一些句子对齐工作。:p 解压后有一个readme文件说明如下: 要处理的中英文文章不一定是对照的。 用你自己的中文文件替换Chinese.txt ,英文文件替换English.txt,文章越长越好。但目前只处理小于100K的文件. 目前程序处理:中文句子仅按照 " 。"分割;英文句子仅按照" . " 分割;暂未处理数字小数点等特殊情况,所以句子分的不好。简单测试对书面语结果好一些。 优点是速度快,处理非完全对照中英文文献好。...
Back
顶部