chrisyang
普通会员
关于BNC-Baby的两个问题:
1. BNC-Baby 构成设计部分(http://www.natcorp.ox.ac.uk/corpus/baby/baby-des.html )说其口语部分包含30个文本,可是文本清单部分 (http://www.natcorp.ox.ac.uk/corpus/baby/thebib.html)上只能找到29个,缺失的那个文本的文件名是什么呢?
下面是那29个文本的文件名(已经做成了WST4适用的形式):
D:\BNC WORLD\Texts\K\KB\KB5
D:\BNC WORLD\Texts\K\KB\KB7
D:\BNC WORLD\Texts\K\KB\KBC
D:\BNC WORLD\Texts\K\KB\KBD
D:\BNC WORLD\Texts\K\KB\KBH
D:\BNC WORLD\Texts\K\KB\KBJ
D:\BNC WORLD\Texts\K\KB\KBP
D:\BNC WORLD\Texts\K\KB\KBW
D:\BNC WORLD\Texts\K\KC\KCC
D:\BNC WORLD\Texts\K\KC\KCF
D:\BNC WORLD\Texts\K\KC\KCU
D:\BNC WORLD\Texts\K\KC\KCV
D:\BNC WORLD\Texts\K\KD\KD0
D:\BNC WORLD\Texts\K\KD\KD1
D:\BNC WORLD\Texts\K\KD\KD3
D:\BNC WORLD\Texts\K\KD\KD7
D:\BNC WORLD\Texts\K\KD\KD8
D:\BNC WORLD\Texts\K\KD\KDD
D:\BNC WORLD\Texts\K\KD\KDF
D:\BNC WORLD\Texts\K\KD\KDJ
D:\BNC WORLD\Texts\K\KE\KE2
D:\BNC WORLD\Texts\K\KE\KE4
D:\BNC WORLD\Texts\K\KN\KNR
D:\BNC WORLD\Texts\K\KP\KP2
D:\BNC WORLD\Texts\K\KP\KP5
D:\BNC WORLD\Texts\K\KP\KP7
D:\BNC WORLD\Texts\K\KP\KPU
D:\BNC WORLD\Texts\K\KP\KPX
D:\BNC WORLD\Texts\K\KS\KSN
2. BNC-Baby网页上说,该语料库包含有128个文本(见7.2. BNC-baby delivery format at http://www.natcorp.ox.ac.uk/corpus/baby/cdifsmop.html ),可是根据网页(http://www.natcorp.ox.ac.uk/corpus/baby/thebib.html)上提供的所含文本信息,文本总数应为181个,其中spoken部分29个 academic部分30个, fiction 部分25个,newspaper部分97个。那BNC-Baby到底包含多少个文本?是128个,181个,还是182个?
另:手头有BNC Sampler的C友能否帮忙告诉我该库语料包含哪些文本?可否将其文件名上传??
1. BNC-Baby 构成设计部分(http://www.natcorp.ox.ac.uk/corpus/baby/baby-des.html )说其口语部分包含30个文本,可是文本清单部分 (http://www.natcorp.ox.ac.uk/corpus/baby/thebib.html)上只能找到29个,缺失的那个文本的文件名是什么呢?
下面是那29个文本的文件名(已经做成了WST4适用的形式):
D:\BNC WORLD\Texts\K\KB\KB5
D:\BNC WORLD\Texts\K\KB\KB7
D:\BNC WORLD\Texts\K\KB\KBC
D:\BNC WORLD\Texts\K\KB\KBD
D:\BNC WORLD\Texts\K\KB\KBH
D:\BNC WORLD\Texts\K\KB\KBJ
D:\BNC WORLD\Texts\K\KB\KBP
D:\BNC WORLD\Texts\K\KB\KBW
D:\BNC WORLD\Texts\K\KC\KCC
D:\BNC WORLD\Texts\K\KC\KCF
D:\BNC WORLD\Texts\K\KC\KCU
D:\BNC WORLD\Texts\K\KC\KCV
D:\BNC WORLD\Texts\K\KD\KD0
D:\BNC WORLD\Texts\K\KD\KD1
D:\BNC WORLD\Texts\K\KD\KD3
D:\BNC WORLD\Texts\K\KD\KD7
D:\BNC WORLD\Texts\K\KD\KD8
D:\BNC WORLD\Texts\K\KD\KDD
D:\BNC WORLD\Texts\K\KD\KDF
D:\BNC WORLD\Texts\K\KD\KDJ
D:\BNC WORLD\Texts\K\KE\KE2
D:\BNC WORLD\Texts\K\KE\KE4
D:\BNC WORLD\Texts\K\KN\KNR
D:\BNC WORLD\Texts\K\KP\KP2
D:\BNC WORLD\Texts\K\KP\KP5
D:\BNC WORLD\Texts\K\KP\KP7
D:\BNC WORLD\Texts\K\KP\KPU
D:\BNC WORLD\Texts\K\KP\KPX
D:\BNC WORLD\Texts\K\KS\KSN
2. BNC-Baby网页上说,该语料库包含有128个文本(见7.2. BNC-baby delivery format at http://www.natcorp.ox.ac.uk/corpus/baby/cdifsmop.html ),可是根据网页(http://www.natcorp.ox.ac.uk/corpus/baby/thebib.html)上提供的所含文本信息,文本总数应为181个,其中spoken部分29个 academic部分30个, fiction 部分25个,newspaper部分97个。那BNC-Baby到底包含多少个文本?是128个,181个,还是182个?
另:手头有BNC Sampler的C友能否帮忙告诉我该库语料包含哪些文本?可否将其文件名上传??