搜寻结果

  1. A

    古汉语典籍的语料处理问题

    古汉语语料处理首先需要分词,目前没有公开的古汉语分词软件,研究者自己开发的东西分词效果也不太好,需要人工校对。 只有分词之后才谈得上其它的分析问题。 建议楼主使用论坛上的工具先在汉字间添加空格,再使用文本处理器批量合成多字词,最后人工修改。
  2. A

    双语双标注新闻语料库样本

    I appriciate your hard word, hoping you can find a way to get it alined in a word-by-word way. That's where it values more.
  3. A

    NLPIR大数据搜索与挖掘共享平台

    把分词文件导入EXCEL表格,再按列复制就可以了。
  4. A

    [原创讨论]计算机时代汉语的一大问题及对策建议

    回复: [原创讨论]计算机时代汉语的一大问题及对策建议 别太过关注分词问题了,其实最要命的还是语法分析,最终的落脚点还在汉语的句子究竟是什么的问题上。例如:“让美更美”,即使分词正确,句法分析却难以进行。
  5. A

    求助:如何检索 "开心的消息”这样的搭配?

    回复: 求助:如何检索 "开心的消息”这样的搭配? 估计语义关系不大,因为“a的n”中,a可能属于其前面的名词如“他 优秀 的 原因”,或者属于前面的动词如“想 明白 的 时候”。 无论怎样,先需要词性标注。
  6. A

    现代汉语语法分析系统测试,寻求帮助。

    回复: 现代汉语语法分析系统测试,寻求帮助。 说明一下,该语法分析系统能够初步识别‘载 满 人 的 希望“中的“载 满”属于动补结构,而“看见 满 屋 是 烟”中的“满”为定中结构。过几天把输出格式搞定后,我会把句法分析后的《围城》全文发上来。只是原文错误太多,实在不好看。
  7. A

    现代汉语语法分析系统测试,寻求帮助。

    回复: 现代汉语语法分析系统测试,寻求帮助。 无人关注,只好自己顶一下。
  8. A

    现代汉语语法分析系统测试,寻求帮助。

    求助内容如标题。 需要钱老的《围城》txt完整文本,GB2312编码,未分词,无错误。网上下载了几种文本,但错误太多,且多处乱码,难以评估分析结果。 期待各位的帮助。
  9. A

    【新工具】Treetagger在线版之无限制本地增强版 1.0

    回复: 【新工具】Treetagger在线版之无限制本地增强版 1.0 不错,很好用,顶一个。
  10. A

    汉语语义标注语料库的开发,欢迎提供建议

    为了便于讨论,先行提供一点讨论的方向。 (1)语义标注的基础在于语言学理论的支持,认知语义学的相关理论在此可以发挥巨大作用。我们目前的做法是以分词结果文件为基础,然后采用“实体词--关系词--虚词”三分的语义模式。 (2)标注采用XML格式,分为“自然语言词单位vs概念词单位”与“概念词单位vs层级系统”两个模块。
  11. A

    OpenCorpus 漢語分析軟件V1.0

    回复: OpenCorpus 漢語分析軟件V1.0 非常好用,很了不起。 美中不足的是检索速度还有待提高,希望作者继续努力,早日能够有更新版。
  12. A

    百度统计机器翻译的可喜收获

    回复: 百度统计机器翻译的可喜收获 下面是我对百度翻译的一个测试句子。 汉语: 你的话我听不懂。 翻译: I can't hear you understand.
  13. A

    MyTxtSegTagTool汉语分词和词性标注工具

    回复: SegTag汉语分词和词性标注工具 同意12#的看法:“拿印欧语的鞋,套汉语的脚。”这是徐通锵老先生的观点,我一直为这个观点而激动。希望“字本位”思想别因徐老过世而销声匿迹。反正我会坚持的。
  14. A

    求助:如何用标注集去标注语料库

    回复: 求助:如何用标注集去标注语料库 可以使用批量替换的办法,但是需要预制一个替换词库。之后再手工校订,这是我们最常用的办法,可以节省很多力气。
  15. A

    Corpus4u.org 虚拟主机准备搬家,征求大家意见。

    回复: Corpus4u.org 虚拟主机准备搬家,征求大家意见。 主要是速度问题,只要不影响速度就问题,搬家期间会中断服务吗,如果是,请提前告。几天前登不上论坛,还以为是日本地震引起的呢。
  16. A

    转一篇网上文章,关于语料标注的讨论

    回复: 转一篇网上文章,关于语料标注的讨论 文章不错,把标注目的总结为三种模式:top-down, bottom-up, cycle,具有提纲挈领的作用。值得一读,谢谢。
  17. A

    LJCorpus中文语料库分析软件推荐

    回复: LJCorpus中文语料库分析软件推荐 软件很不错,操作比较方便。这是基于现代汉语的分词系统,不知有没有对古汉语进行分词的系统,年前有任务对一部分古汉语进行分词,没办法自制了一个词库挂上去了,效果非常的不好。
  18. A

    如何自动将大量名词按语义分类,如实体词,抽象词,状态词等

    回复: 如何自动将大量名词按语义分类,如实体词,抽象词,状态词等 应该是我的学生问的问题,真是太懒了。
  19. A

    关于中文语料库句长及词汇频率问题

    回复: 关于中文语料库句长及词汇频率问题 恐怕得先学学如何使用Access,这类问题在Access中很容易解决。其实,语料库的核心就是数据库。
  20. A

    ”语料库与外语研究高级研修班报名“最新通知(2009.10.12)

    回复: ”语料库与外语研究高级研修班报名“最新通知(2009.10.12) 网络培训班是个好主意,可能不是没人感兴趣,而是能够得到相关信息的人实在不多。只身参加学习班固然好,但远地爱好者实在折腾不起。
Back
顶部