关于keyword的reference corpus的小疑惑

本文由 mirror-tea2013-07-02 发表於 "语料库语言学入门" 讨论区

  1. :)想请教下,如果我要用keyword功能比较两个小型语料库,reference corpus的字数一定要比被比较的语料库的字数多吗?

    比如两两年的报纸相比较,后一年的字数少,可以作为reference corpus吗

    :D谢谢老师了
     
  2. 李亮1975重庆

    李亮1975重庆 语料库快乐军政委

  3. 回复: 两个库不必容量相同

    O(∩_∩)O老师的教程做的好生动啊

    全看完了,老师您也说了,最经典的跨库对比是大库为参照库,小库为对比库,可如果我把报纸每年都建一个库,然后两两对比,很难确保参照库就一定比对比库大,这样没关系吗?

    谢谢老师答疑~~
     
  4. 李亮1975重庆

    李亮1975重庆 语料库快乐军政委

    回复: 两个库不必容量相同

    没关系的,只要有几十万单词或汉字就行啊,硕士论文不用那么认真的。
     
  5. 回复: 两个库不必容量相同

    ^_^谢谢老师,老师好厉害,一看就看出了我是写硕士论文
     
  6. 李亮1975重庆

    李亮1975重庆 语料库快乐军政委

    这本书是针对小库的

    Small Corpus Studies and Elt_Theory and Practice 2002,这本书很清晰的思路。
     

    附件文件:

  7. 回复: 这本书是针对小库的

    太感谢老师了,我这就去看O(∩_∩)O
     
  8. 回复: 关于keyword的reference corpus的小疑惑

    很受用!感谢楼主,感谢李博士!
     
  9. 回复: 关于keyword的reference corpus的小疑惑

    creating your own corpora is not a simple task as you told. It may take a long time and also you may have to work really hard too so better refer any other book
     
    Last edited: 2014-11-08
  10. 回复: 关于keyword的reference corpus的小疑惑

    难得有教程能够让我们边看边笑。
    亮哥实在是专业,热心肠又幽默。:)
     
  11. 老师,我也有几个关于这方面的问题想请教下~
    1、添加的词表中列的频率是raw frequency还是normalized frequency?
    2、keyness代表的就是差异性么?
    3、我想对比的是两个库中程度副词的使用情况,但是最后显示出来的几乎是按keyness排列的原库中所有的单词,有没有可能只显示程度副词呢?