xiongwx的最近内容

  1. X

    语料库索引行随机筛选工具Concordance Randomizer

    回复: 语料库索引行随机筛选工具Concordance Randomizer 缺 comdlg32.ocx ,这是一个通用对话框控件。一般是点击某个按钮之后,弹出对话框,如打开哪个文件之类的。缺少这个控件,就不能使用选择打开功能。这是较早的windows开发控件。解决办法是下载该控件,可参见http://www.skycn.com/soft/41346.html
  2. X

    求“A的A,B的B”格式语料!重复结构的检索

    回复: 求“A的A,B的B”格式语料! 如果你自己有文本的话,不妨用正则表达式 (.*)的\1 试试,看看能不能检索出这种复用格式。
  3. X

    求:熊文新博士主讲的"双语文本的对齐与检索"的材料.

    回复: 求:熊文新博士主讲的"双语文本的对齐与检索"的材料. 孙老师,刚检索才发现有指名问我的内容。迟复为歉。 以下是PPT大概介绍的内容,欢迎指正。上传挺费事的,要求小于500K,需要我再给您发邮件。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 双语语料库: 双语语料库以句对(sentence pair)为主; 技术界 vs. 学术界 追求目标不同: 量与质 技术方法不同: 服务于机器的算法与人的研究 属性标注不一: 语言本体与语言应用 双语语料获取 Web作为平行语料库...
  4. X

    MyTxtSegTagTool汉语分词和词性标注工具

    回复: SegTag汉语分词和词性标注工具 有个好用的segtag来自Mandel SHI之手。“基于隐马尔科夫模型的分词标注程序,使用PASCAL语言编写-Hidden Markov Model-based sub-word tagging procedures, using the PASCAL language”
  5. X

    【求助】为什么不能生成WECCL的子库?

    回复: 【求助】为什么不能生成WECCL的子库? 是否有权限,请用管理员身份试试。
  6. X

    中英双语在线(CEO)测试已开通

    回复: 中英双语在线(CEO)测试已开通 商业软件太贵,mysql对于咱们的语料库应该够了。提高性能从其他方面考虑了。 咱们的语言形式检索不同于信息检索的主题检索,TF*IDF等排序好像不合适。
  7. X

    中英双语在线(CEO)测试已开通

    回复: 中英双语在线(CEO)测试已开通 服务器down了,刚远程重启服务器,希望能运行。
  8. X

    编程,我的看法

    回复: 编程,我的看法 就做界面来说,还是VB/C#来得方便;文本处理,我还是用perl顺手,用的时间长,先入为主,况且还有CPAN那么庞大的modules,基本上是想要什么就都有什么。其实这些大多数程序设计语言结构都差不多,咱们语言处理用的字符串,文件处理,regex...
  9. X

    强化法制建设,对齐法律文本供分享

    回复: 强化法制建设,对齐法律文本供分享 当检索串是文本中某一字符串的字串时会出现这种情况。当用like之类的数据库检索时,可能会造成数据不准确。当用户检索"go",good,goods都会出来。我现在的处理是在着色时确定某条记录是否符合要求,这样count数据库中满足条件的记录和实际着色结果的记录数量可能不一,不知laohong有什么好方法?好像你用的是jsp,也用jdbc,还是其他检索包?
  10. X

    中英双语在线(CEO)测试已开通

    回复: 中英双语在线(CEO)测试已开通 各位新年好,刚找到原来注册的密码,能够上来了。 谢谢laohong和各位的建议: 1. 原来有中英文两个页面,英文页面调用的程序,数据库用户和密码在服务器和我的本地机不一样,我也没改,所以出现了laohong所说的错误提示。sorry。 2. 在本机调试的时候,我试过regular expression来查询mysql,速度较慢,如果在网络环境,我担心更慢,大家就更没兴趣了。所以干脆给撤了那个英文页面。 3. 中英文混合检索已在内部测试之中,像(克服 困难...
  11. X

    Sentence Segmenter

    回复: Sentence Segmenter I am flattered,Jiajin.
  12. X

    Sentence Segmenter

    回复: Sentence Segmenter Two files are needed. if you want to do your job, double click batch.bat The tokens in bold are added by myself to meet your need. Have fun! ########################## ## batch.bat ########################## perl test.pl ########################## ## test.pl...
顶部