回复: 请问谁知道北大现代汉语语料库中的翻译作品这部分语料共有多少字?
The CCL corpus (264,444,436 characters, compiled by Centre for Chinese Linguistics PKU) contains 13.8% translated texts.
查询主页的语料分布, 点"字数", 里面有总字数, 点击"现代", 里面有翻译作品的字节数, 除以总字节数, 就得到上面的百分数, 如果想要字数, 可以大概算一下. 我知道的就这么多了. 不明白建库时为什么要把翻译的文本也包含进去, 不明白..., 实在是不明白.
查询时怎样就可以不查询翻译文本? 要简便点的方法. 哪位知道?