请教独特词有没有软件可以实现检索?

#1
冯庆华(2008)提到了“特色词”和“独特词”。
其中,“特色词”是“在一个文本中词频较高而另一个类似文本或其它多个类似文本词频较低的词汇”,并指出“除了类似文本以外,一个或几个比较成熟的语料库统计的相关词频数据也可以成为定义特色词的依据”。
其研究主要是以红楼梦杨译本为参考来考察红楼梦霍译本的特色词,他提出两个选择标准:“首先是本方词汇在全文的出现必须是10次以上,其次是作为参照方词汇在全文出现的次数必须在本方词汇次数的五分之一以下。本方词汇在全文出现次数如不足15,作为参照方的词汇在全文出现的次数只能是1。以此标准,上不封顶。”
而所谓独特词,是指“在一个文本中词频达到一定水准而在另一个类似文本或其它多个类似文本中词频为零的词语”。“对某一文本进行独特词研究,我们可以较客观地对该文本展开风格分析”。

其中特色词characteristic words应该可以用诸如AntConc里的Keywords生成主题词表的做法来检索,不过具体的频次设置细节就不知能否有工具来做了。

而“独特词”unique words应该如何检索?这个后学一时没弄明白,不知有没有哪位大贤帮忙指点一下?多谢各位老师了!
 

李亮1975重庆

语料库快乐军政委
#2
特色词与独特词提取的四个战略层次

【初级方案:有屈折的单词】不加载屈折表而对比两库词频,优点是操作或开发都简单,缺点是复数与比较级与过去时态之类的屈折造成了较大的频率计算误差;

【中级方案:无屈折的单词】加载屈折表或先把语料库变成“无屈折的词组成的库”,优点是大量名词动词形容词得到更加准确的测量;

【高级方案:无屈折的词组】针对剔除了屈折变化的库进行Ngram提取,优点是(名词动词形容词副词)词组得到了计算机会,尤其是名词词串得到了提取;

【超级方案:无屈折的词、搭配词及其词组】一个词的特色和独特不仅体现在自身的频率,更体现在与什么词搭配,因为一个词可能是高频词,但在另一个库或领域有“特色搭配词”或“独特搭配词”,而那些搭配词也许单独看也并非特色词或独特词。
 

oscar3

高级会员
#3
冯庆华(2008)提到了“特色词”和“独特词”。
其中,“特色词”是“在一个文本中词频较高而另一个类似文本或其它多个类似文本词频较低的词汇”,并指出“除了类似文本以外,一个或几个比较成熟的语料库统计的相关词频数据也可以成为定义特色词的依据”。
其研究主要是以红楼梦杨译本为参考来考察红楼梦霍译本的特色词,他提出两个选择标准:“首先是本方词汇在全文的出现必须是10次以上,其次是作为参照方词汇在全文出现的次数必须在本方词汇次数的五分之一以下。本方词汇在全文出现次数如不足15,作为参照方的词汇在全文出现的次数只能是1。以此标准,上不封顶。”
而所谓独特词,是指“在一个文本中词频达到一定水准而在另一个类似文本或其它多个类似文本中词频为零的词语”。“对某一文本进行独特词研究,我们可以较客观地对该文本展开风格分析”。

其中特色词characteristic words应该可以用诸如AntConc里的Keywords生成主题词表的做法来检索,不过具体的频次设置细节就不知能否有工具来做了。

而“独特词”unique words应该如何检索?这个后学一时没弄明白,不知有没有哪位大贤帮忙指点一下?多谢各位老师了!
冯老师所说的独特词有两种处理方式。一、通过Antconc的主题词工具,两个文本互相参考所形成的主题词。二、香港理工大学有一个索引软件上有一个unique words的功能。我用过这个软件,但是,其原理没有仔细了解。以上仅供参考。
 
#4
回复: Re: 请教独特词有没有软件可以实现检索?

冯老师所说的独特词有两种处理方式。一、通过Antconc的主题词工具,两个文本互相参考所形成的主题词。二、香港理工大学有一个索引软件上有一个unique words的功能。我用过这个软件,但是,其原理没有仔细了解。以上仅供参考。
多谢!请问是在港理工的哪个页面呢?

AntConc的主题词应该是冯老师所说的“特色词”而不是独特词吧。
 
顶部