搜寻结果

  1. I

    ictclas汉语分词求助

    回复: ictclas汉语分词求助 Trados和雪人都是商业软件,合法使用都需要购买。你可以试试梁茂成教授开发的AutoAligner,下面这个网页上有介绍。 http://heep.fltrp.com/shupei/newsdetails.asp?icntno=225522&classno=000&subclassno=967
  2. I

    ictclas汉语分词求助

    回复: ictclas汉语分词求助 http://www.corpus4u.org/forum/showthread.php?t=8831 登陆 http://www.lingjoin.com/demoCenter#anchor 注册后可免费下载LJParser,里面有ICTCLAS2013的分词工具。
  3. I

    语料库软件查询汉语成语

    回复: 语料库软件查询汉语成语 词典里有些成语有重复的,刚才用PowerConc(Concordance->Stats)发现的,抱歉。 1 臭味相投 2 口口声声 3 明知故犯 4 人仰马翻 5 人之常情 6 死于非命 7 有目共睹 8 瓜田李下 9 情不自禁 10 人面桃花 11 依依不舍 12 议论纷纷 13 饱食终日 14 本性难移 15 不败之地 16 不可终日 17 侧目而视 18 吹灰之力 19 诲人不倦 20 祸从口出 21 积毁销骨 22 鸡犬升天 23 立地成佛 24 量体裁衣 25 旁观者清 26 轻于鸿毛 27 食不甘味 28 死而后已 29 天高地厚 30...
  4. I

    语料库软件查询汉语成语

    回复: 语料库软件查询汉语成语 刚才动手做了个用于批处理的成语词典文件,但里面还有些词是否为成语还有待商榷,且该表并不能说已经穷尽了汉语里的成语,欢迎大家补充修正。大伙如能提出其他表,我们可以把它们不断汇总合并,以后也好有个公共资源。 参考文献: 何平主编. 2004. 汉语成语词典. 成都: 电子科技大学出版社.
  5. I

    语料库软件查询汉语成语

    回复: 语料库软件查询汉语成语 成语标注或分词不一定要,用成语字典文件进行批量检索就可以了(如用北外PowerConc的批量检索功能)。这样的话结果可能会含有不符合要求的情况,但比例应当不大(这个比例倒值得去计算一下)。标注的话准确率可能会高一点(高多少也是个有趣的问题),但也需要一个成语字典文件做分词时用的用户自定义词典。
  6. I

    语料库软件查询汉语成语

    回复: 语料库软件查询汉语成语 你需要个汉语成语文件
  7. I

    ICTCLAS 分词系统 用户词典

    回复: ICTCLAS 分词系统 用户词典 另外,从你的调用函数来看,应该不是ICTCLAS最近的版本。ICTCLAS有多个版本,不同版本之间调用可能有些区别。
  8. I

    ICTCLAS 分词系统 用户词典

    回复: ICTCLAS 分词系统 用户词典 根据ICTCLAS附带的文档可以判断,ICTCLAS并不主张修改核心词典,修改用户词典的调用函数应该是ICTCLAS_AddUserWord和ICTCLAS_SaveTheUsrDic(如果使用的是C++),我参照的是ICTCLAS2011接口文档,你再检查检查看看。
  9. I

    十万加急,如何在汉语语料库中检索“一V”格式呀~~~

    回复: 十万加急,如何在汉语语料库中检索“一V”格式呀~~~ http://124.193.83.252/cqp/ 里在LCMC用CQP syntax检索 "一" [pos="v"],可查到 “一 笑” 、“一 毕业” 等结构。
  10. I

    ictclas汉语分词求助

    回复: ictclas汉语分词求助 YACSI 0.96 与ICTCLAS2013不兼容,因为其调用函数发生了一些变化,你需要用ICTCLAS2012才能用它进行批处理。
  11. I

    R自然语言处理模块

    回复: R自然语言处理模块 Thanks.
  12. I

    ictclas汉语分词求助

    回复: ictclas汉语分词求助 To solve this problem, a newer version of ICTCLAS2012 is needed. Unfortunately, I'm currently running out of time to do any experiment. A quick (and easy) way is to stick to the ANSI option provided you are working on a system supporting Chinese. When I've managed to find some...
  13. I

    求高人指点BNCweb的simple query syntax

    回复: 求高人指点BNCweb的simple query syntax Hope this file helps. http://cwb.svn.sourceforge.net/viewvc/cwb/gui/cqpweb/trunk/doc/Simple_query_language.pdf
  14. I

    莫言小说里最常用的名词 The most frequent nouns in Mo Yan's fictions

    回复: 莫言小说里最常用的名词 The most frequent nouns in Mo Yan's fictions 有意思。还有表示亲属关系、人体器官、动物名称的词也很多,看过他作品的可以解释一下吗?
  15. I

    Download: Twitter tokenizer and POS tagger (version 0.3)

    回复: Download: Twitter tokenizer and POS tagger (version 0.3) Seems to be tailored to the new social media, quite interesting, thanks.
  16. I

    ictclas汉语分词求助

    回复: ictclas汉语分词求助 Can you post a short sample of your text here? ICTCLAS2012 is known to have problems with some messy texts, for example, a combination of Chinese and English. Maybe a cleanup of the input text is needed.
  17. I

    统计之都-R在中国的大本营

    回复: 统计之都-R在中国的大本营 他山之石,可以攻玉,确实不假。 看了这个论坛里一些人(尤其是谢益辉、邱怡轩、魏太云、刘思喆等)的工作,有些与语言研究有关,有些与语言研究无关,但都令人大开眼界,触动很深。
  18. I

    统计之都-R在中国的大本营

    http://cos.name/ 中国统计学门户网站,R在中国的大本营,非常富有活力。 鉴于Gries使用R进行语言研究的影响,这是一个值得我们关注的社区。
  19. I

    Metadata_Encoder2语料库文本元信息标注辅助工具2.0版

    回复: Metadata_Encoder2语料库文本元信息标注辅助工具2.0版 Thanks. It works nicely on my computer.
  20. I

    英国版权法有可能出现松动

    Data mining given the go ahead in UK Data mining, the process of analysing data for trends and patterns, will be made exempt from UK copyright laws. The change is part of the government’s plans to modernize the UK’s intellectual property laws, and is based on the recommendations made by Ian...
Back
顶部