关于卡方检验的问题

我想对比两个语料库bundle使用区别,但如果按照相同频率划分,其中一个语料库使用的bundle远远多于另一个语料库,想请问能否选取频率在各语料库中排在前100的进行卡方检验?
 
Back
顶部