我要做那个工作的原因有很多,其中最主要原因之一:
假设有一本经典书藉,原文为拉丁文,有无数的语言译本。
要研究这本书,我会为原文做一个 Concordance,而当然不是为中文译本而做。
然而,现在的目标是更大的。不单是我研究,也要让所有阅读这本电子书的用户能够自行研究。他们会使用的介面是中文/译文,而不是原文。因此必须另外建立出一个 译文-原文的关系表(有很多词语不免是一对多,多对一的),这样原文 Concordance 及 词频才能产生作用。
电脑软件能够辅助的条件,我构想它的运作逻辑可以是:
1...