有关QUITA (Quantitative Text Analyzer)以及文本标注的问题想要请教各位前辈

鄙人为英语本科的大四学生,拜读了刘海涛先生主编的《计量语言学导论》之后,对于计量语言学产生了兴趣,所以毕业论文我选择了该方向的内容,并且计划使用QUITA软件对文本进行分析。但是因为鄙人没有相关的计算机基础,在实际使用的时候遇到比较大的困难,其一就是文本主题集中度的计算。
个人先自主尝试解决该问题。
首先,我根据QUITA软件主题集中度(TC)计算的要求下载了相应的python插件(3.9.2 for windows),但是不管文本的长度如何,对其的处理一直处于进行中,没有产生结果,也不能进行其他操作,是否因为需要加速器?
其次,我想直接使用处理过后(词性标注、词形还原)的文本放入QUITA进行分析,于是我又使用了TreeTagger,在命令提示符窗口进行操作,分析出了每个词的词性以及原来的词形,我也在python上运行过NLTK,但是我不知如何使其成为QUITA可计算出主题集中度的文本。我查了网络资源,可能是因为查找方法不当或者查找关键词不对,没有找到相关的内容。
接下来个人打算继续去图书馆查阅一些著作,看能否发现一些有用的信息。
但同时也希望有经验的前辈们能帮我解决疑惑,给我一些建议和指导!在此感激不尽!!!
 
Back
顶部