关于COCA美国国家语料库中子库的大小问题

#1
根据论文“美国当代英语语料库(COCA)—英语教学与研究的良好平台”(汪兴富,2008)关于COCA的介绍,可知当时(2007)的新闻类别下的体育新闻字符总数(NEWS: Sports 11, )是162, 901,但却不知道这个数字是如何得来的?

根据最新的COCA的介绍(1990-2012)已有450 MILLION WORDS, 只知道例如:
YEAR SPOKEN FICTION MAGAZINE NEWSPAPER ACADEMIC TOTAL
2012 2,348,159 2,294,570 2,203,821 2,109,683 2,298,658 11,254,891*

指导某年每个大类的总体字符数,至于大类下的子类如新闻大类下的体育新闻有多少字符数却无从得知?

求解汪兴富(2008)中以下子库的总字符数是如何得来的:
报纸子库(8个) 子库总字数
NEWS: Editorial 4, 063, 608
NEWS: L ife 12, 883, 821
NEWS:Misc 24, 691, 477
NEWS:Money 6, 295, 632
NEWS:News_ Intl 3, 731, 400
NEWS:News_Local 5, 237, 152
NEWS:News_Natl 5, 318, 754
NEWS: Sports 11, 162, 901
 

oscar3

高级会员
#2
回复: 关于COCA美国国家语料库中子库的大小问题

You need to provide more information about (汪兴富,2008), such as the journal title and the issue number of the journal, so we can check data you quote here.

根据论文“美国当代英语语料库(COCA)—英语教学与研究的良好平台”(汪兴富,2008)关于COCA的介绍,可知当时(2007)的新闻类别下的体育新闻字符总数(NEWS: Sports 11, )是162, 901,但却不知道这个数字是如何得来的?

根据最新的COCA的介绍(1990-2012)已有450 MILLION WORDS, 只知道例如:
YEAR SPOKEN FICTION MAGAZINE NEWSPAPER ACADEMIC TOTAL
2012 2,348,159 2,294,570 2,203,821 2,109,683 2,298,658 11,254,891*

指导某年每个大类的总体字符数,至于大类下的子类如新闻大类下的体育新闻有多少字符数却无从得知?

求解汪兴富(2008)中以下子库的总字符数是如何得来的:
报纸子库(8个) 子库总字数
NEWS: Editorial 4, 063, 608
NEWS: L ife 12, 883, 821
NEWS:Misc 24, 691, 477
NEWS:Money 6, 295, 632
NEWS:News_ Intl 3, 731, 400
NEWS:News_Local 5, 237, 152
NEWS:News_Natl 5, 318, 754
NEWS: Sports 11, 162, 901
 
顶部