会不会没结论呢?中,你指的是哪中方言啊,只是普通话吗?普通话有台湾省的因素,如果他们的搭配有不同,能代表全中国吗?如果不能,你的选择是否很难找到较多歌词?英,你指哪国的英?泛指?全世界?我觉得这是很需要解决的问题,而不是数量的多少或字数的多少。各位高手前辈好!最近想做一个关于中英文歌词语言中超常规搭配现象对比的研究。在准备小小的语料库的时候有个疑问,用什么来衡量这两个语料库的对应程度呢?是从语篇的数量上还是总字数上呢?例如,是说中英文各100首歌歌词还是中英文各3万字呢?谢谢解答!
reference corpus意为参照语料库,是针对你研究所选取的语料库(称为observed corpus观察语料库)作为参照的,其作用就如同一把尺子,提供相应的参照标准。例如LZ要研究歌词的语言特征,那么可以自己先建立一个英文歌词语料库,再选取一个通用语料库,如美国英语口语语料库,作为reference corpus。两相比较,如通过主题词表,就可以发现歌词与普通日常口语不同的显著语言特征。通常参照语料库与观察语料库应尽量保持一致。如后者为口语语料库,那么前者也必须是口语库。且通常前者的库容要比后者大些。请教楼主一个小小的问题:什么叫reference corpora?使用条件是什么?即,何时可以为相互reference?
万分感谢。