有关QUITA (Quantitative Text Analyzer)以及文本标注的问题想要请教各位前辈

neleye · 2021-03-16

鄙人为英语本科的大四学生，拜读了刘海涛先生主编的《计量语言学导论》之后，对于计量语言学产生了兴趣，所以毕业论文我选择了该方向的内容，并且计划使用QUITA软件对文本进行分析。但是因为鄙人没有相关的计算机基础，在实际使用的时候遇到比较大的困难，其一就是文本主题集中度的计算。
个人先自主尝试解决该问题。
首先，我根据QUITA软件主题集中度（TC）计算的要求下载了相应的python插件（3.9.2 for windows），但是不管文本的长度如何，对其的处理一直处于进行中，没有产生结果，也不能进行其他操作，是否因为需要加速器？
其次，我想直接使用处理过后（词性标注、词形还原）的文本放入QUITA进行分析，于是我又使用了TreeTagger，在命令提示符窗口进行操作，分析出了每个词的词性以及原来的词形，我也在python上运行过NLTK，但是我不知如何使其成为QUITA可计算出主题集中度的文本。我查了网络资源，可能是因为查找方法不当或者查找关键词不对，没有找到相关的内容。
接下来个人打算继续去图书馆查阅一些著作，看能否发现一些有用的信息。
但同时也希望有经验的前辈们能帮我解决疑惑，给我一些建议和指导！在此感激不尽！！！

liyuxi · 2024-06-05

作者 neleye:
鄙人为英语本科的大四学生，拜读了刘海涛先生主编的《计量语言学导论》之后，对于计量语言学产生了兴趣，所以毕业论文我选择了该方向的内容，并且计划使用QUITA软件对文本进行分析。但是因为鄙人没有相关的计算机基础，在实际使用的时候遇到比较大的困难，其一就是文本主题集中度的计算。
个人先自主尝试解决该问题。
首先，我根据QUITA软件主题集中度（TC）计算的要求下载了相应的python插件（3.9.2 for windows），但是不管文本的长度如何，对其的处理一直处于进行中，没有产生结果，也不能进行其他操作，是否因为需要加速器？
其次，我想直接使用处理过后（词性标注、词形还原）的文本放入QUITA进行分析，于是我又使用了TreeTagger，在命令提示符窗口进行操作，分析出了每个词的词性以及原来的词形，我也在python上运行过NLTK，但是我不知如何使其成为QUITA可计算出主题集中度的文本。我查了网络资源，可能是因为查找方法不当或者查找关键词不对，没有找到相关的内容。
接下来个人打算继续去图书馆查阅一些著作，看能否发现一些有用的信息。
但同时也希望有经验的前辈们能帮我解决疑惑，给我一些建议和指导！在此感激不尽！！！

同问！所以您的问题解决了么？

Jade Jug · 2024-08-28

作者 liyuxi:
同问！所以您的问题解决了么？

github搜linguistics feature，这个项目提供quita的python实现。quita有的地方是有一些bug。如果会r，可以找quitaup这个项目

有关QUITA (Quantitative Text Analyzer)以及文本标注的问题想要请教各位前辈

neleye

liyuxi

Jade Jug