在毕业论文中,准备自己建立一个由汉译英的英文文本构建的翻译语料库。试图研究该语料库中的“动词+名词”的搭配使用情况。试图利用母语语料库BNC做对比研究。具体的路径是,首先从BNC中提取出频数最高的名词,形成一个词表。之后,再检索这些高频词的“动词+名词”搭配。再以这个高频词表为基准,从翻译语料库中提取相应的“动词+名词”搭配。之后,分析本族语语料库中的搭配同翻译语料库中的搭配的差异。
现在问题是,有两个关键的技术处理手段没有掌握:
一:BNC中名词的frequency wordlist 怎么提取?
二:提取后的名词,如何检索它的“动词+名词”搭配?
现在问题是,有两个关键的技术处理手段没有掌握:
一:BNC中名词的frequency wordlist 怎么提取?
二:提取后的名词,如何检索它的“动词+名词”搭配?