搜寻结果

  1. Q

    关于T,Z, MI

    回复: 关于T,Z, MI 论坛有人讨论过Z和T: http://corpus4u.org/forum/showthread.php?t=6701 Manning的书专门有一章讲T和MI如何识别搭配词,T检验讲得尤其详细: Foundations of Natural Language Processing, Chapter 5
  2. Q

    Cornell Movie-Dialogs Corpus (English)

    回复: Cornell Movie-Dialogs Corpus (English) 是吗?请问哪一期啊?
  3. Q

    请教Biber的几本书的各自侧重点

    回复: 请教Biber的几本书的各自侧重点 Biber是第一个用MDA方法研究语言学现象的,可他没告诉读者该怎么“做”研究。 你就算把Biber那几本书都读了,估计也不知道该怎么应用。 McEnery的书要具体很多,教会读者怎么操作。因此我觉Biber的书和McEnery的要结合 起来看,可能掌握得更快。
  4. Q

    请教Biber的几本书的各自侧重点

    回复: 请教Biber的几本书的各自侧重点 挑一本看看主要章节就行,然后动手做个小研究。 推荐看 McEnery等人的 Corpus Based Language Studies,C.5 Conversation and speech in American English
  5. Q

    O'Reilly出的一本语料库的书

    难得O'Reilly还出有关语料库建设的书: Natural Language Annotation for Machine Learning A Guide to Corpus-Building for Applications http://shop.oreilly.com/product/0636920020578.do 好像还没正式出版,有个early release版,感兴趣的同志可以百毒一下。:)
  6. Q

    卡方检验求帮助

    回复: 卡方检验求帮助 可以直接比啊,画个柱装图,这叫描述性统计。 卡方检验是推论性统计。首先要搞清楚卡方检验比的是比率的差异。 比如一个词word在10,000词的语料库A里出现了100次,在8,000词的语料库B里出现了 90次,你想知道这个词在各个语料库里所占的比率是否有差异。 一般在卡方检验里比率用odds表示,比如在语料库A里word出现的odds是 (100/10,000) / (9900/10,000) = 1/99 意思是在该样本中不出现word的概率是出现word的99倍。 在语料库B中的odds是 90/7910。...
  7. Q

    How to interpret a contingency table?

    Suppose we have the following data about the relationship between people's race and their belief in life after death (Agresti 2007 An Introduction to Categorical Data Analysis: 206) (This is another way of presenting a 3 x 2 contingency table) race belief freq 1 white yes...
  8. Q

    卡方检验求帮助

    回复: 卡方检验求帮助 For your 1st question: Yes, you can use chi-squared test. You may want to organize your data in the following way. AgeGroup WordFrequency OtherWordsFrequency ag1 a b ag2 c d ag3 e...
  9. Q

    计量语言学

    刘海涛老师的一篇介绍计量语言学的短文: http://epaper.gmw.cn/gmrb/html/2012-02/15/nw.D110000gmrb_20120215_3-16.htm
  10. Q

    Larson-Hall's Statistics in SLA Using R

    http://cw.routledge.com/textbooks/9780805861853/guide-to-R.asp Jennifer Larson-Hall's companion guide of using R in SLA research to the book A Guide to Doing Statistics in Second Language Research Using SPSS
  11. Q

    R自然语言处理模块

    http://cran.r-project.org/web/views/NaturalLanguageProcessing.html 列举了R中许多与自然语言处理相关的模块。
  12. Q

    原创《语料搜集:桌面级的网页抓取技术与工具》

    回复: 原创《语料搜集:桌面级的网页抓取技术与工具》 够详细,学习了。多谢!
  13. Q

    请教大家,我到底是哪里出了问题???

    回复: 请教大家,我到底是哪里出了问题??? 编码的事,你的文档是用unicode保存的。用记事本把文档另存为 utf-8 格式的再用 antconc 就可以了。
  14. Q

    请教大家,我到底是哪里出了问题???

    回复: 请教大家,我到底是哪里出了问题??? 你把要检索的整个文本贴上来让大家看看吧。
  15. Q

    请教~~两个数可以进行卡方检验,考察两者间的差异性吗??

    回复: 请教~~两个数可以进行卡方检验,考察两者间的差异性吗?? 这是本论坛中以往的讨论: http://www.corpus4u.org/forum/search.php?searchid=119984
  16. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 In the attached paper, the degree of freedom of T-test (pp. 129) is fractional. Maybe we need to spell out the software and algorithm used in our paper.
  17. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 In the R manual about oneway.test. It states that the algorithm is based on an article: http://www.soph.uab.edu/Statgenetics/People/MBeasley/Courses/Welch1951.pdf To understand all the formulas and notations is hard, and maybe unnecessary for us.
  18. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 http://en.wikipedia.org/wiki/Degrees_of_freedom_%28statistics%29 In this page, it says, "http://en.wikipedia.org/wiki/Degrees_of_freedom_%28statistics%29 In some complicated settings, such as unbalanced split-plot designs, the sums-of-squares no longer have scaled...
  19. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 你给的文章数据呈现格式好像有些问题,这个清楚些: http://www-psych.stanford.edu/~herb/2000s/Clark.FoxTree.02.pdf
  20. Q

    HH Clark的统计算法

    回复: HH Clark的统计算法 心理语言学的研究者好像特别喜欢用方差分析,各种方差分析。以至于他们连百分比差异都用方差分析,也挺有意思的。 有的心理语言学论文通篇都是F值,看来练好一种武功也能行走江湖了。:)
Back
顶部