miaocai的最近内容

  1. M

    SUBTLEX-CH:中文字頻/詞頻/標注詞頻(PoS)

    回复: SUBTLEX-CH:中文字頻/詞頻/標注詞頻(PoS) 可以下載。並已更新。提供單個文件,添加拼音和英語翻譯參考。 近期會增加提供多種在線查詢。:)
  2. M

    求现代汉语词频表Chinese Wordlist

    回复: 求现代汉语词频表 http://expsy.ugent.be/subtlex-ch/ SUBTLEX-CH提供基于影视字幕语料库的简体中文词频和字频。 与日渐增长的研究需求相比,可获取的中文词频资源匮乏,尤其是多字词的词频资源。因此,我们建立了四千七百万字(三千三百万词)的SUBTLEX-CH简体中文字幕语料库,对其进行了分词和词性标注,提供了字频,词频,词性(PoS),以及带词性的词频。 与之前New, Brysbaert等同事对基于字幕语料的英语,法语,荷兰语词频的研究结果相似,我们对词汇命名(word naming)和词类测试(lexical...
  3. M

    求现代汉语词频表Chinese Wordlist

    回复: 求现代汉语词频表 因為中文編碼也有多種 而且有時候沒有指定會被編碼成其他語言。 剛剛release了我們的新的詞頻表,希望可以幫到。 http://www.corpus4u.org/showthread.php?p=36481#post36481
  4. M

    SUBTLEX-CH:中文字頻/詞頻/標注詞頻(PoS)

    本詞頻基于四千七百万汉字(三千三百万词)的电影电视字幕和ICTCLAS汉语分词技术。 基于中文詞匯word naming和lexical decision的實驗數據,与现存幾個词频表的詞頻进行了比较,显示這些詞頻对RT的解释作用最优。 這里我們提供三個頻率表的完全版本的免費下載,供非盈利的學術研究交流: http://expsy.ugent.be/subtlex-ch/ 具体实现方法和细节,请参考和引用: Cai, Q. & Brysbaert, M (in press). SUBTLEX-CH: Chinese Word and Character Frequencies...
Back
顶部