关于keyword的reference corpus的小疑惑

:)想请教下,如果我要用keyword功能比较两个小型语料库,reference corpus的字数一定要比被比较的语料库的字数多吗?

比如两两年的报纸相比较,后一年的字数少,可以作为reference corpus吗

:D谢谢老师了
 
回复: 两个库不必容量相同

O(∩_∩)O老师的教程做的好生动啊

全看完了,老师您也说了,最经典的跨库对比是大库为参照库,小库为对比库,可如果我把报纸每年都建一个库,然后两两对比,很难确保参照库就一定比对比库大,这样没关系吗?

谢谢老师答疑~~
 
回复: 两个库不必容量相同

O(∩_∩)O老师的教程做的好生动啊

全看完了,老师您也说了,最经典的跨库对比是大库为参照库,小库为对比库,可如果我把报纸每年都建一个库,然后两两对比,很难确保参照库就一定比对比库大,这样没关系吗?

谢谢老师答疑~~
没关系的,只要有几十万单词或汉字就行啊,硕士论文不用那么认真的。
 
这本书是针对小库的

Small Corpus Studies and Elt_Theory and Practice 2002,这本书很清晰的思路。
 

附件

  • Small Corpus Studies and Elt_Theory and Practice 2002.pdf
    3.1 MB · 浏览: 204
回复: 关于keyword的reference corpus的小疑惑

creating your own corpora is not a simple task as you told. It may take a long time and also you may have to work really hard too so better refer any other book
 
Last edited:
回复: 关于keyword的reference corpus的小疑惑

难得有教程能够让我们边看边笑。
亮哥实在是专业,热心肠又幽默。:)
 
两个库不必容量相同

在antconc中的keyword list功能的操作流程,可以看我的图文教程的第12页开始的内容
http://www.docin.com/p-469407203.html

老师,我也有几个关于这方面的问题想请教下~
1、添加的词表中列的频率是raw frequency还是normalized frequency?
2、keyness代表的就是差异性么?
3、我想对比的是两个库中程度副词的使用情况,但是最后显示出来的几乎是按keyness排列的原库中所有的单词,有没有可能只显示程度副词呢?
 
Back
顶部