请教各位:统计语块时怎么对其进行标注最方便呢?

我刚刚接触语料库,很多最基本的问题还不清楚。现在我要自己建一个中美大学生记叙文的语料库,比较语块的使用模式。有很多问题要请教前辈们。统计之前我首先要对文章中语块进行标注是吗?怎么样标注比较方便统计呢?烦求各位指点一二。不胜感激!
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

我刚刚接触语料库,很多最基本的问题还不清楚。现在我要自己建一个中美大学生记叙文的语料库,比较语块的使用模式。有很多问题要请教前辈们。统计之前我首先要对文章中语块进行标注是吗?怎么样标注比较方便统计呢?烦求各位指点一二。不胜感激!

首先,搞清楚语块是什么?
然后根据其界定进行分类,确定是应该标注后提取呢?还是自动提取。

可搜索本站,本站内有不少关于此方面的论文。
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

我刚刚接触语料库,很多最基本的问题还不清楚。现在我要自己建一个中美大学生记叙文的语料库,比较语块的使用模式。有很多问题要请教前辈们。统计之前我首先要对文章中语块进行标注是吗?怎么样标注比较方便统计呢?烦求各位指点一二。不胜感激!

要标注词块?如果库容小的话倒是可以尝试一下,但是如果库容大的话,就够你受的了。最好采取计算机提取,加人工勘定的方法。建议参考 王建新 著 计算机语料库的建设和应用 一书,P172 语料库自动提取搭配的研究,卫乃兴 著 词语搭配的界定与研究体系 P51 提取词丛方法。 但是搭配是不是就是你所指的词块,还是要你自己来决定。如楼上所说,先要弄清楚什么是词块或语块。
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

首先,搞清楚语块是什么?
然后根据其界定进行分类,确定是应该标注后提取呢?还是自动提取。

可搜索本站,本站内有不少关于此方面的论文。
多谢您的指点。我是应该再多看些资料,不能急于操作。
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

要标注词块?如果库容小的话倒是可以尝试一下,但是如果库容大的话,就够你受的了。最好采取计算机提取,加人工勘定的方法。建议参考 王建新 著 计算机语料库的建设和应用 一书,P172 语料库自动提取搭配的研究,卫乃兴 著 词语搭配的界定与研究体系 P51 提取词丛方法。 但是搭配是不是就是你所指的词块,还是要你自己来决定。如楼上所说,先要弄清楚什么是词块或语块。
太感谢了。我现在也在看语块方面的书,试图根据需要给出一个操作性定义。
多谢您的指点!
 
请教各位:CLAWS 7

《中国学生英语口笔语语料库》中的SECCL子库语料没有进行词性赋码,请问各位如果要赋码的话,是否要用CLAWS 7 软件进行自动赋码,该软件在哪可以买到,价格大约多少?:)
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

谢谢!但是他的赋码集与CLAWS的不一样,而《中国学生英语口笔语语料库》中的WECCL子库语料是用CLAWS进行赋码的,如果要对SECCL和WECCL作比较的话,是否都用 CLAWS进行赋码比较科学?请问哪里可以获取CLAWS?
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

你可以用检索功能看到关于正则表达式的相关概念。
 
回复: 请教各位:统计语块时怎么对其进行标注最方便呢?

谢谢!我在百度和Google里都搜了,但没有搜到,请问还有其他途径吗?
 
Back
顶部