求教关于两个BNCWeb检索系统检索结果差异很大的原因

chrisyang

普通会员
本人使用BNC(CQP-Edition)对Dr.Xiao在Corpus-Based Language Studies: An advanced resource book一书中的第四个实例分析(Swearing in modern British English)进行了实际操作计算练习。在检索中发现,使用BNC(CQP-Edition)检索后得到数据跟Richard在该书中提供的使用NBCWeb(University of Zurich)检索得到的相差很多。不知到原因何在?

检索结果对比:

1. 对fuck一词的检索结果
Dr. Xiao提供的数据Figure C4.6 The Distribution of fuck on P.268 :见附件001A
本人使用BNC(CQP-Edition)检索到的结果:见附件001B

2.对fuck|fucked|fucks|fuckin|fucking|fucker|fuckers七个词同时检索后,得到的讲话者性别与年龄列联数据结果
Dr. Xiao提供的数据(Figure C4.9 The cross-tabulation of speaker gender and age on P.275):见附件002A
本人使用BNC(CQP-Edition)检索到的结果:见附件002B
 

附件

  • 001A.png
    001A.png
    5.5 KB · 浏览: 1
  • 001B.jpg
    001B.jpg
    33.2 KB · 浏览: 3
  • 002A.png
    002A.png
    10.8 KB · 浏览: 0
  • 002B.jpg
    002B.jpg
    69.2 KB · 浏览: 4
回复: 求教关于两个BNCWeb检索系统检索结果差异很大的原因

Different results are shown because the two user interfaces are based on different versions of the BNC. The BNCWeb in the book at Zurich is based on BNC version 2 and CQP edition of BNCweb is based the latest BNC XML edition. Some errors in text classification are corrected in the XML edition. See the BNC home http://www.natcorp.ox.ac.uk/XMLedition/ for other changes in the new version.
 
回复: 求教关于两个BNCWeb检索系统检索结果差异很大的原因

Thank you so much for your timely response, Richard.
 
Back
顶部