想问问篇章层面的语言参数有哪些

各位大佬,求助一下!我在用语料库做译本风格的研究。想问问篇章层面的语言参数有哪些?连词、介词数量能算吗?

目前看了一下汉语可读性分析工具ARC,据说是分析词汇、句法、语义三个维度的九个语言指标,但感觉这好像不能够说明篇章层面上面的问题。还请各位大佬指点~​

 
各位大佬,求助一下!我在用语料库做译本风格的研究。想问问篇章层面的语言参数有哪些?连词、介词数量能算吗?

目前看了一下汉语可读性分析工具ARC,据说是分析词汇、句法、语义三个维度的九个语言指标,但感觉这好像不能够说明篇章层面上面的问题。还请各位大佬指点~​

在这篇文章里我们用了25个篇章层面的特征:https://corpus.bfsu.edu.cn/coh-explicit.zip
其中所用工具Coh-metrix目前已不再维护。
可用Kristopher Kyle的TACCO代替:https://www.linguisticanalysistools.org/taaco.htmlxiex
 
在这篇文章里我们用了25个篇章层面的特征:https://corpus.bfsu.edu.cn/coh-explicit.zip
其中所用工具Coh-metrix目前已不再维护。
可用Kristopher Kyle的TACCO代替:https://www.linguisticanalysistools.org/taaco.html
许教授,近期我使用了这个工具,发现可能不太适合我在做的研究。因为我是对汉译本的研究,所以这个软件可能不支持汉语的参数提取。所以我现在想的一个解决办法是,用正则表达式去提取代词、连词,这样研究reference, conjunction, and substitution
 
许教授,近期我使用了这个工具,发现可能不太适合我在做的研究。因为我是对汉译本的研究,所以这个软件可能不支持汉语的参数提取。所以我现在想的一个解决办法是,用正则表达式去提取代词、连词,这样研究reference, conjunction, and substitution
用正则表达式自己去提取是可以的。
可以通过PatCount工具(https://corpus.bfsu.edu.cn/wxPatCount.zip)批量提取相关语言特征,得到数据矩阵,进而进行后续的统计分析。
 
用正则表达式自己去提取是可以的。
可以通过PatCount工具(https://corpus.bfsu.edu.cn/wxPatCount.zip)批量提取相关语言特征,得到数据矩阵,进而进行后续的统计分析。
感谢许教授的解答!最近在做研究时还碰到一些困惑,就是汉语平均句长计算的是汉字个数呢还是词数?将原文本放进wordsmith里面呢还是分词后的?而至于句段长,目前应该没有现成工具,只能使用正则表达式。但是否需要把标点包含在内?
 
汉语比较做句长分析。
汉语中句号和逗号使用不像英语那样受到句法的明确约束。
 
Back
顶部