搜寻结果

  1. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 作者还提到uh和um后的停顿的时间是否有显著差异;这个还比较好解释。 自变量是 填充语,是分类变量 它有两个 level: Level 1: uh;Level 2:um 因变量是 停顿时间 是连续性变量 当自变量是分类变量;因变量是连续性变量时使用方差分析。当只有一个自变量时,用单因素方差分析。注意对比的是因变量的均值差异(如83页图2所示) 你可以用统计软件R做一次实验。你把附件中的数据放到我的文档中,打开R,输入下面的命令: data <- read.table("03-1_uh(m).txt",sep="\t",header=T)...
  2. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 单因素方差分析的自由度: 分子自由度: k-1;k为自变量的类别数量;文中为1;因为自变量填充语只有两类:uh和um; 分母自由度:n-k;n为样本量;文中为342;说明作者在LL corpus中共发现了344例uh和uhm。 哪位熟悉LL格式的C友可以验证下。它那格式太复杂,我实在看不明白啊。
  3. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 这个确实比较诡异啊。百分数差异用方差分析? 难道作者这样列的数据: uh uhm 0 1 1 0 0 0 1 1 1 0 0表示没有delay;1表示有delay。这样算的均值倒也是百分比 (0+1+0+1+1) / 5 = 0.6 = 60% 从他列的自由度来看,(1:342)很有可能。
  4. Q

    句式结构检索

    回复: 句式结构检索 看一下这里面的文章,用PatterBuilder获得检索式 http://www.corpus4u.org/forum/showthread.php?t=5125&highlight=patternbuilder
  5. Q

    求语义标注工具

    回复: 求语义标注工具 可以试一下这里介绍的三款软件: http://nlp.stanford.edu/links/statnlp.html#SRL
  6. Q

    参考文献管理软件

    回复: 参考文献管理软件 Zotero出3.0版本了,可以不用FF浏览器单独使用。http://www.zotero.org/support/3.0
  7. Q

    一本语料库翻译学新书,值得期待!

    回复: 一本语料库翻译学新书,值得期待! Oakes真是10年磨一剑啊。不过他的书看起来太费劲了,这本估计也不好懂。
  8. Q

    Good News!

    回复: Good News! 课程终于开始了,下面是主办方的通知: We're really happy to tell you that our Natural Language Processing course begins on Monday March 12! Thank you all for your encouraging emails and your patience during these past weeks. You can register and access the class at: http://nlp-class.org/
  9. Q

    求教正则表达式

    回复: 求教正则表达式 用一个文本编辑器,比如Notepad++什么的,在替换与查找中选择 正则表达式,然后在 Find what中输入<.*?> 点击replace all。 同理,在Find what中输入Task \d 再点replace all。
  10. Q

    Library.nu/gigapedia.info 現在關門,Admin可能被起訴

    回复: Library.nu/gigapedia.info 現在關門,Admin可能被起訴 也是好事,有时间把下来的书好好看看了。:)
  11. Q

    Stefan Th. Gries Companion website of Quantitative corpus linguistics with R

    回复: Stefan Th. Gries Companion website of Quantitative corpus linguistics with R Another book written by Gries, Statistics for Linguistics with R http://www.linguistics.ucsb.edu/faculty/stgries/research/sflwr/sflwr.html
  12. Q

    Good News!

    从2012年1月23日起,Manning和Jurafsky要在网上免费教授为期八周的自然语言处理课程,期待中。。。 http://www.nlp-class.org
  13. Q

    一个语言学者的控诉

    why we need good tools... Because we're not all interested in being R experts. By far, the single most frustrating part of my own graduate linguistics experience was the fact that in order to study the kinds of linguistic phenomena I wanted to, I had to spend most of my time learning...
  14. Q

    Manning的PPT

    介绍了很多自然语言处理的工具,pptx格式的,word2003的可以从网上下个插件打开: http://www-nlp.stanford.edu/~manning/courses/DigitalHumanities/DH2011-Manning.pptx
  15. Q

    跪求《拓展基于语料研究的范围——新应用,新挑战》PDF

    回复: 跪求《拓展基于语料研究的范围——新应用,新挑战》PDF http://www.amazon.cn/%E6%8B%93%E5%B1%95%E5%9F%BA%E4%BA%8E%E8%AF%AD%E6%96%99%E7%A0%94%E7%A9%B6%E7%9A%84%E8%8C%83%E5%9B%B4-%E6%96%B0%E5%BA%94%E7%94%A8-%E6%96%B0%E6%8C%91%E6%88%98-%E6%A0%BC%E5%85%B0%E5%A5%87/dp/B002A9J0L4/ref=sr_1_1?ie=UTF8&qid=1325321303&sr=8-1
  16. Q

    请问BNCweb版中,怎么算MI值?

    回复: 请问BNCweb版中,怎么算MI值? 用上面的简单公式好像和BNC web里的对不上,比如检索charming,跨距设为L3-R3,与搭配词witty的关系是: f(charming) : 1342 f(witty) : 413 f(chamring,witty): 8 f(total): 98313429 得到MI = 7.8527 不知怎么算的。 当有跨距时的计算方法很多文献都语焉不详,我觉得下面这篇文章的第27页的figure 7和30页的average MI论证的比较在理:...
  17. Q

    请问BNCweb版中,怎么算MI值?

    回复: 请问BNCweb版中,怎么算MI值? 公式很简单,参见 Manning, C. D., & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, MA: the MIT Press. 第166页 http://nlp.stanford.edu/fsnlp/promo/colloc.pdf
  18. Q

    菜鸟问题:为什么 E-C Concord 每次检索最多只可查500条,那从501以后的平行语料怎么看呢?

    回复: 菜鸟问题:为什么 E-C Concord 每次检索最多只可查500条,那从501以后的平行语料怎么看呢? "再则,从网址上判断,香港教育学院的这个在线语料库是CGI编程,应该是Perl或Python是服务器端的编程语言了,更大的可能性是Perl 了,Python的可能性紧随其后,其他的什么C或D编程语言也不是不可能的,反正CGI编程就是古老的互联网的DOS上网时代的产物了," 应该是C吧,.exe文件。不认为CGI那么古老,好多开源的框架在更新。Perl的最新网络架构是Catalyst: http://www.catalystframework.org/
  19. Q

    菜鸟问题:为什么 E-C Concord 每次检索最多只可查500条,那从501以后的平行语料怎么看呢?

    回复: 菜鸟问题:为什么 E-C Concord 每次检索最多只可查500条,那从501以后的平行语料怎么看呢? 受李亮同志启发,直接改成 http://ec-concord.ied.edu.hk/scripts/cgi-bin/ParaConc2.exe?SearchStr=said&Corpus=alice.en&Maximum=1000
  20. Q

    菜鸟问题:为什么 E-C Concord 每次检索最多只可查500条,那从501以后的平行语料怎么看呢?

    回复: 菜鸟问题:为什么 E-C Concord 每次检索最多只可查500条,那从501以后的平行语料怎么看呢? 牛啊。看来作者还得加个 selected = 500 if selected > 500. 请问这样能不被“黑”吗?:)
Back
顶部