本詞頻基于四千七百万汉字(三千三百万词)的电影电视字幕和ICTCLAS汉语分词技术。
基于中文詞匯word naming和lexical decision的實驗數據,与现存幾個词频表的詞頻进行了比较,显示這些詞頻对RT的解释作用最优。
這里我們提供三個頻率表的完全版本的免費下載,供非盈利的學術研究交流:
http://expsy.ugent.be/subtlex-ch/
具体实现方法和细节,请参考和引用:
Cai, Q. & Brysbaert, M (in press). SUBTLEX-CH: Chinese Word and Character Frequencies...