求助:本科毕业论文自建小型语料库相关问题

本文由 lucunculus2016-04-06 发表於 "语料库研究习作" 讨论区

  1. 想请教一下各位前辈:

    我是想通过语料库的方法对比某一作家的小说,Twitter, 及访谈文本,来找出其中语言使用一致的地方,问题如下:
    1. 首先是否可以就以上三类文本分别建库(通过查阅相关书籍,比较困惑的地方在于不知道这三类文本是否符合否构成语料库的要求,即,这三类文本是三类文本集,还是能算做语料库)
    2.如可分别构成小型语料库,是否可以两两进行对比(或将小说文本作为参照语料库)
    3.如不可对比,改如何选取参照语料库
    补充:小说语料是该作家的4本书的全部内容;Twitter 是2012年至今的全部推文,共计3000多条;访谈文本是一共5次,约1万字。

    感激不尽!