asking的最近内容

  1. A

    古汉语典籍的语料处理问题

    古汉语语料处理首先需要分词,目前没有公开的古汉语分词软件,研究者自己开发的东西分词效果也不太好,需要人工校对。 只有分词之后才谈得上其它的分析问题。 建议楼主使用论坛上的工具先在汉字间添加空格,再使用文本处理器批量合成多字词,最后人工修改。
  2. A

    双语双标注新闻语料库样本

    I appriciate your hard word, hoping you can find a way to get it alined in a word-by-word way. That's where it values more.
  3. A

    NLPIR大数据搜索与挖掘共享平台

    把分词文件导入EXCEL表格,再按列复制就可以了。
  4. A

    [原创讨论]计算机时代汉语的一大问题及对策建议

    回复: [原创讨论]计算机时代汉语的一大问题及对策建议 别太过关注分词问题了,其实最要命的还是语法分析,最终的落脚点还在汉语的句子究竟是什么的问题上。例如:“让美更美”,即使分词正确,句法分析却难以进行。
  5. A

    求助:如何检索 "开心的消息”这样的搭配?

    回复: 求助:如何检索 "开心的消息”这样的搭配? 估计语义关系不大,因为“a的n”中,a可能属于其前面的名词如“他 优秀 的 原因”,或者属于前面的动词如“想 明白 的 时候”。 无论怎样,先需要词性标注。
  6. A

    现代汉语语法分析系统测试,寻求帮助。

    回复: 现代汉语语法分析系统测试,寻求帮助。 说明一下,该语法分析系统能够初步识别‘载 满 人 的 希望“中的“载 满”属于动补结构,而“看见 满 屋 是 烟”中的“满”为定中结构。过几天把输出格式搞定后,我会把句法分析后的《围城》全文发上来。只是原文错误太多,实在不好看。
  7. A

    现代汉语语法分析系统测试,寻求帮助。

    回复: 现代汉语语法分析系统测试,寻求帮助。 无人关注,只好自己顶一下。
  8. A

    现代汉语语法分析系统测试,寻求帮助。

    求助内容如标题。 需要钱老的《围城》txt完整文本,GB2312编码,未分词,无错误。网上下载了几种文本,但错误太多,且多处乱码,难以评估分析结果。 期待各位的帮助。
  9. A

    【新工具】Treetagger在线版之无限制本地增强版 1.0

    回复: 【新工具】Treetagger在线版之无限制本地增强版 1.0 不错,很好用,顶一个。
  10. A

    汉语语义标注语料库的开发,欢迎提供建议

    为了便于讨论,先行提供一点讨论的方向。 (1)语义标注的基础在于语言学理论的支持,认知语义学的相关理论在此可以发挥巨大作用。我们目前的做法是以分词结果文件为基础,然后采用“实体词--关系词--虚词”三分的语义模式。 (2)标注采用XML格式,分为“自然语言词单位vs概念词单位”与“概念词单位vs层级系统”两个模块。
  11. A

    OpenCorpus 漢語分析軟件V1.0

    回复: OpenCorpus 漢語分析軟件V1.0 非常好用,很了不起。 美中不足的是检索速度还有待提高,希望作者继续努力,早日能够有更新版。
  12. A

    百度统计机器翻译的可喜收获

    回复: 百度统计机器翻译的可喜收获 下面是我对百度翻译的一个测试句子。 汉语: 你的话我听不懂。 翻译: I can't hear you understand.
  13. A

    MyTxtSegTagTool汉语分词和词性标注工具

    回复: SegTag汉语分词和词性标注工具 同意12#的看法:“拿印欧语的鞋,套汉语的脚。”这是徐通锵老先生的观点,我一直为这个观点而激动。希望“字本位”思想别因徐老过世而销声匿迹。反正我会坚持的。
  14. A

    求助:如何用标注集去标注语料库

    回复: 求助:如何用标注集去标注语料库 可以使用批量替换的办法,但是需要预制一个替换词库。之后再手工校订,这是我们最常用的办法,可以节省很多力气。
  15. A

    Corpus4u.org 虚拟主机准备搬家,征求大家意见。

    回复: Corpus4u.org 虚拟主机准备搬家,征求大家意见。 主要是速度问题,只要不影响速度就问题,搬家期间会中断服务吗,如果是,请提前告。几天前登不上论坛,还以为是日本地震引起的呢。
顶部