怎样换算词频以及BNC Indexer的使用

各位老师,向您请教,用CLEC和BNC语料库检索出了原始的词频,为了统一对比两个不同容量的语料库的词频,若要换算成百万词频,如何计算呢,十分感谢
另外,BNC Indexer在语料库中只有index文件,其sid文件打不开,请问如何查找使用呢,前面老师给过的网址是web indexer,如何在BNC中用sara检索定语料呢,再次感谢,敬礼!
 
Last edited:
回复: 怎样换算词频以及BNC Indexer的使用

请专家老师给予指导,谢谢
 
回复: 怎样换算词频以及BNC Indexer的使用

liuda,你在那两张BNC语料库光盘里找到原始语料了?我还是没找到
请问你是怎么做到的?可以告诉我吗? 万分感谢!!
 
回复: 怎样换算词频以及BNC Indexer的使用

我的是压缩好的一个包,没有碟,原始语料,库文件看不到,但用sara检索时会出现
 
回复: 怎样换算词频以及BNC Indexer的使用

关注此帖中,求各位老师帮忙!!
 
回复: 怎样换算词频以及BNC Indexer的使用

急需老师的帮助,BNC indexer下载下来了软件,不能确定words的数量,比如我需要40万词的左右的university essays or popular magazines,拼凑了一整天也没凑对,选择后,在我安装的语料库sara中又打不开,是要手动按文件夹一个一个选择建立子语料库吗,请老师指教,非常感谢
 
回复: 怎样换算词频以及BNC Indexer的使用

请问找到答案了么,我也向换算词频
 
回覆: 怎样换算词频以及BNC Indexer的使用

第一个问题,你的意思是都要换算成标准化词频吧,有个公式 标准化词频=观察频数/总体频数*1,000,000,就可以换算成每百万的词频数
 
Back
顶部