wandong的最近内容

  1. W

    我已经把语料和论文发给您了,望您查收

    我已经把语料和论文发给您了,望您查收
  2. W

    北外双语平行语料库最新消息

    北大平行语料库,大概是20万对,有一万对是做到词对齐的。是为了做统计机器翻译用的,主要是让计算机从里面学习有用的汉语语言知识。由于是用计算机对齐的,个人感觉不适合语言研究用。
  3. W

    关于连词的问题

    请你发给我一个有效的信箱,我可以给你经过标注的有关连词的语料,因为我硕士论文是做这方面研究的。
  4. W

    树库编辑工具(TreeEditor)

    回复: 树库编辑工具(TreeEditor) 目前,汉语完全句法分析的技术还不成熟,基本上处于实验室的阶段,所以没有像分词和词性标注这样的比较成熟的软件可供大家用。把Stanford Parser转换成能检索的格式非常麻烦,在一定程度上会影响抽取的结果。
  5. W

    wordsmith 5.0已经在上海出版了

    回复: wordsmith 5.0已经在上海出版了 现在汉语分词和词性标注基本上达到了让人可以接受的地步,中文信息处理界的人士应该开发一个基于汉语的面向中国汉语和外语研究者的类似Wordsmith的东西,而不是一味的玩各种统计模型,为写paper而过分追求什么精确率和召回率. 是静下心来,用己所学做些对大家真正有用的东西时候了!!!
  6. W

    词汇库的发展如何?

    回复: 词汇库的发展如何? 词汇库应该不仅仅是词典吧 目前基于计算机的大规模汉语词汇库,应该有下面这些: 董振东先生HowNet体系下的词汇库。 北京大学的中文概念词典 (CCD)下的词汇库,与wordnet比较相似。 陈小荷先生905工程语义分析体系的词汇库。
  7. W

    第四届学生计算语言学研讨会论文录取名单

    基于临界带特征矢量距离的端点检测算法 基于PAT-TREE快速获取流行词语方法研究 基于交互增强原理的多文档自动文摘算法 一种基于N-Best结果组合优选的词语对齐方法 网页去重系统的设计与实现 交通工具名识别系统的设计与实现 统计与规则结合的古文对联应对模型 基于语料库的初中学生词语偏误现象考察 基于内容特征的垃圾博客过滤 基于特征自动选取的汉语词义消歧 《蒙古语语法信息词典叹词分库》的建设及难点分析 基于双语平行语料的分层次命名实体抽取 一种利用关键词提取的面向查询多文档文摘技术 基于K-最近距离方法的哈萨克语报纸分类初探...
  8. W

    梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

    回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成 首先,表示祝贺. 再次,不知道用的是什么机器学习模型,同时正如楼上xujiajing所说,不是机考很难实现,就是实现了机考,在目前计算语言学歧义问题丛生的前提下,基本上也是一个toy.不如从英语教学和考试的角度,开发一些机器辅助的英语作文自动评分系统更有价值. 最后,再次表示祝贺.
  9. W

    有这种“通用的随机抽样工具” 吗

    回复: 有这种“通用的随机抽样工具” 吗 我这里有个简单的随即抽样的软件,是我们自己用VC写的,如果你感兴趣的话,可以给我发邮件,我发给你. 邮箱:yangminggaol@163.com 非常感谢您发来的软件!
  10. W

    请问:用什么软件可以统计汉语句长

    回复: 请问:用什么软件可以统计汉语句长 定义句子确实是一个麻烦的问题,在做句法分析器的时候这个问题尤其令人头疼.在中文信息处理界.可能是以标号来作为一个句子的,如".?!"等.
  11. W

    想要对汉语语料做这样几件事,应该怎样操作?

    回复: 想要对汉语语料做这样几件事,应该怎样操作? 如果您从这个论坛上得不到"找出其中频率最高的名词、动词、形容词等"这个结果,可以给我联系,我可以给您提供部分统计结果. yangminggaol@163.com
  12. W

    语料库_百度百科

    回复: 语料库_百度百科 上面这些人专门从事语料库研究的不是太多,但大多数与语料库有关系,大家有兴趣的话可以看看。
  13. W

    语料库_百度百科

    回复: 语料库_百度百科 转引自刘老师的博客:中文信息学会人物谱 北京大学:俞士汶(常务理事)、孙 斌(理事,计算语言所副所长)、王厚峰、穗志方(女)、李素建(女);李晓明(天网、信息检索)、闫鸿飞(天网);吴玺宏(视听觉实验室) 清华大学:黄昌宁(理事)、孙茂松(副理事长,计算语言学专业委员会主任)、陈群秀(理事,女)、苑春法、周强(句法分析);马少平(理事,信息检索)、张敏;蔡莲红(理事,语音合成专家,女);方棣棠(语音识别)、王作英(语音识别)、郑方(语音识别);丁晓青(汉字识别,女) 中国科学院计算技术研究所:倪光南(理事长);白...
  14. W

    请问有没有语料库在对外汉语教学应用的文献

    回复: 请问有没有语料库在对外汉语教学应用的文献 国家教委八五社科规划研究项目、国家汉办八五科研规划项目,1995年11月15日通过专家鉴定。研制人员储诚志、陈小荷等人。 收集了96个国家和地区的1635位外国留学生的成篇成段的汉语作文或练习材料5774篇,共计3528988字,从中抽取了740人的1731篇语料,共44218句,1041274字,进行了分词、词性标注及一些特殊的语言学标注。 全部语料均登录有作者姓名、性别、年龄、国别、是否华裔、第一语言、文化程度、所学主要教材、语料类别、写作时间、提供者等23项属性。...
  15. W

    关于自建语料库的求助和求合作!

    回复: 关于自建语料库的求助和求合作! 我也许可以帮你,我的邮箱 yangminggaol@163.com
顶部