歌词语篇中的人称代词:基于语料库的英汉对比

xujiajin

管理员
Staff member
这是一篇很有意思的文章,虽然杂志不是很好,但是这个点选得还是很不错的。

作者基于自建的容量为32.5万字的英、汉语通俗歌曲歌词平行生语料库,对比统计英汉两种语言人称代词的使用频率,发现歌词语篇中第一、二人称代词占绝对优势,指称主要依靠文外照应。

叶丽珍
华中师范大学外国语学院 湖北武汉430079. http://www.corpus4u.org/upload/forum/2005072722335437.pdf
 
回复:歌词语篇中的人称代词:基于语料库的英汉对比

的确是比较新颖,但是oscar3也有点疑问。1)似乎作者建立的不是平行语料库(parallel corpus),本人参与过北京外国语大学中国外语教育研究中心平行语料库的建设工作,熟悉语料库收集和处理的工序以及环节,英汉双语语料要达到可用,必须进行句级对齐,但是,叶的语料库组成部分的英汉语料并不存在翻译关系,也就不可能做到对齐。因而她建立的语料库应该称为可比语料库comparable corpus才比较恰当。
2)叶将将英文词频表与Brown 和LOB 语料库频数进行比较,这样合适吗?oscar3认为,某些语言形式,如人称代词,在不同的语类(如叙事,说明等)中应该有不同的频次倾向。通用语料库作为经过平衡控制的语料,某些词的频次有可能比某一次类语料的频次低或者高。叶这里建立的语料库应该属于专用语料库(specialized)。我的直觉是,人称代词在两类语料库中的频次不同,其中在通用语料库中出现的频次比专用语料库中的要低。这个猜想不知道有道理没有。而叶的结论却是英文歌词“语料可以代表一般英语使用习惯。”我有点糊涂,请求解惑。
 
We have to be aware that our findings are to a great extent conditioned by the nature of corpus data we use.
 
The results of corpus studies are as good as the corpora used. Only when the corpus data is representative of the language/sublanguage variety can the findings based on such data be reasonably generalised to the language/sublanguage variety under consideration.
 
Back
顶部